Databricks使用镶木与存储为papquet创建表
我正在用ADLS2中的Parquet文件支持的Azure中创建一个数据链球表。
我不理解使用Parquet
和在
的创建table
语句中存储为parquet之间的区别。
特别是,如果我的表具有十进制
列创建表作为Parquet位置'abfss:// ...'
将失败而失败:
Parquet Do不支持小数。请参阅Hive-6384
...除非我设置属性以使用特定的非默认版本的Hive Jars。
另一方面,使用parquet
创建表仅工作。
有什么区别?
I'm creating a Databricks table in Azure backed by Parquet files in ADLS2.
I don't understand the difference between USING PARQUET
and STORED AS PARQUET
in the CREATE TABLE
statement.
In particular, if my table has a decimal
column the CREATE TABLE STORED AS PARQUET location 'abfss://...'
will fail with error:
Parquet does not support decimal. See HIVE-6384
... unless I set properties to use a particular non-default version of Hive JARs.
On the other hand, CREATE TABLE USING PARQUET
just works.
What's the difference?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论