amazon-athena

投稿关注

文章 0 浏览 1

Serde的匹配属性

看来我能够创建具有无效属性的表。例如，“ Some_junk”不是CSV序列化的有效属性。该声明应该失败。 CREATE EXTERNAL TABLE test2 ( f1 string, s2 s…

夏尔 2025-02-13 22:46:33 0 0

雅典娜：将列转换为不同的值

我想将列转换为另一个值，就像拥有地图一样。我目前正在做类似的 SELECT col1, col2, CASE data = 'data1' THEN 'd1' WHEN data = 'data2' THEN 'd2' …

梦幻的心爱 2025-02-13 18:53:52 0 0

需要管道列名称，列编号，数据类型更改检测器的想法 - 胶水

我在AWS中设置了以下管道设置（试图在此处不提供太多公司信息）。这可能是过度简化的，但是这里是。我们有一个ETL过程，其中包含每天爬行的数据源，…

初与友歌 2025-02-13 10:04:15 1 0

雅典娜查询以计算单个IP的总字节

我正在寻找雅典娜查询，以计算每个唯一的IP地址发送和接收的总字节。以下源源 IPDATIOSIIP 方向字节 10.0.0.1 50.1.2.2 具有信息有一个表 …

苦妄 2025-02-12 21:47:08 1 0

删除了几百个分区后，MSCK维修表命令在AWS Athena的速度缓慢

我从AWS Athena表中删除了大约700个分区数据（S3）。要更新分区信息，我正在运行 MSCK修复表命令，但是它的运行时间超过7分钟。在删除700个分区之前…

一张白纸 2025-02-12 21:40:43 1 0

计数雅典娜桌的全部分区

我的雅典娜和雅典娜冰山桌由多列划分。我想在Python脚本中创建一个逻辑，以破坏数据，如果有100多个分区以插入数据而没有错误。显示分区table_name …

罪歌 2025-02-12 18:56:33 1 0

AWS胶合作业有时无法解决＆＃xxx`＆＃xxx`＆＃x27;给定的输入列

当我执行AWS胶合作业时，在雅典娜成功运行的SQL查询语句将在这里报告一个错误，并且似乎通过日志的单引号存在问题。有人知道这里发生了什么吗？ pysp…

还在原地等你 2025-02-12 15:11:15 1 0

将S3文件合并到多个1GB S3文件中

我的存储桶中有多个S3文件。 Input S3 bucket : File1 - 2GB data File 2 - 500MB data File 3 - 1Gb Data file 4 - 2GB data 等等。假设有50个这样的…

毁梦 2025-02-12 08:08:50 1 0

更新AWS胶水表时，可以自动更新分区元数据

我有一个分区的S3桶。我正在使用AWS Athena阅读分区中的数据。我通过云形式堆栈创建了雅典娜中使用的AWS胶水表。如果我更新云形式 S3ServerAccessLog…

放手` 2025-02-11 05:37:17 2 0

使用Neptune连接器执行Athena查询时NullPoInterException错误

我正在尝试从雅典娜执行查询，以显示海王星数据库的数据。我正在使用雅典娜海王星连接器连接到Neptune DB，并在Athena查询编辑中显示数据。但是，当…

沦落红尘 2025-02-10 05:08:00 2 0

显示线从同一列中过滤的不同值

我有一个系统，在该系统中，我们在列中注册，如果是账单，销售订单，发票，采购订单等。这意味着对于相同的ID，我们可以进行1个以上的交易（例如，ID1…

对风讲故事 2025-02-10 04:32:07 2 0

如何根据日期范围从表中获取数据？

是否有可能有一个SQL查询，该查询可以每日日期和客户提取数据？用例：表1有客户购买的商品，并提供购买数据表2具有客户可能取得的所有支持门票…

甲如呢乙后呢 2025-02-09 22:35:38 2 0

如何使用可以在AWS Athena中阅读的熊猫来编写镶木quet文件？

我有一个简单的数据框架，我想转换为镶木quet文件： out_buffer = BytesIO() input_datafame.to_parquet(out_buffer, index=False, compression="gzip…

聆听风音 2025-02-09 22:19:32 3 0

可以从AWS Athena下载CSV数据以可用格式

我在S3存储桶中有70,000多个CSV文件。他们都有相同的标题。我想将文件组合到一个CSV中，我想将其下载到我的计算机上。使用AWS雅典娜，我似乎是大部分…

灰色世界里的红玫瑰 2025-02-09 17:29:28 3 0

我可以为一个新文件获取hive_bad_data，但我可以找到与以前的文件的区别

我将熊猫的数据帧文件保存为S3中的镶木件文件。添加了最后一个文件后，它引起了此错误： hive_bad_data：parquet file s3：// **/resuct_2022-06-16.g…

孤寂小茶 2025-02-09 13:20:29 3 0

共 9 页
1
2
3
4
5
下一页

友情链接

文江博客