我如何在数据映中创建带有Hive格式的外部表格

发布于 2025-01-29 13:11:25 字数 462 浏览 3 评论 0原文

我有一个外部表,蜂巢中的格式下面。

CREATE EXTERNAL TABLE cs_mbr_prov(
  key struct<inid:string,......>, 
  memkey string, 
  ob_id string, 
  .....
)
  
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.hbase.HBaseSerDe' 
STORED BY 
  'org.apache.hadoop.hive.hbase.HBaseStorageHandler' 
WITH SERDEPROPERTIES ( 
  'hbase.columns.mapping'=' :key,ci:MEMKEY, .....', 
  'serialization.format'='1')

我想在Azure Databricks中创建相同类型的表格,其中我的输入和输出为镶木格式。

I am having a external table with below format in hive.

CREATE EXTERNAL TABLE cs_mbr_prov(
  key struct<inid:string,......>, 
  memkey string, 
  ob_id string, 
  .....
)
  
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.hbase.HBaseSerDe' 
STORED BY 
  'org.apache.hadoop.hive.hbase.HBaseStorageHandler' 
WITH SERDEPROPERTIES ( 
  'hbase.columns.mapping'=' :key,ci:MEMKEY, .....', 
  'serialization.format'='1')

I want to create same type of table in Azure Databricks where my Input and Output are in parquet format.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

鯉魚旗 2025-02-05 13:11:25

根据 我创建并再现了 ,用 输入 输出 镶木格式中

示例代码:

CREATE EXTERNAL TABLE `vams`(
  `country` string,
  `count` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
  
STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.SymlinkTextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'dbfs:/FileStore/'
TBLPROPERTIES (
  'totalSize'='2335',
  'numRows'='240',
  'rawDataSize'='2095',
  'COLUMN_STATS_ACCURATE'='true',
  'numFiles'='1',
  'transient_lastDdlTime'='1418173653')

”

”

参考:

https://learn.microsoft.com/en-us/azure /databricks/spark/最新/spark-sql/language-manual/sql-ref-syntax-ddl-create-table-table-hiveformat

As per the official Doc I created and reproduced the table with Input and Output are in parquet format.

Sample code:

CREATE EXTERNAL TABLE `vams`(
  `country` string,
  `count` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
  
STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.SymlinkTextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'dbfs:/FileStore/'
TBLPROPERTIES (
  'totalSize'='2335',
  'numRows'='240',
  'rawDataSize'='2095',
  'COLUMN_STATS_ACCURATE'='true',
  'numFiles'='1',
  'transient_lastDdlTime'='1418173653')

Ref1

Ref3

Reference:

https://learn.microsoft.com/en-us/azure/databricks/spark/latest/spark-sql/language-manual/sql-ref-syntax-ddl-create-table-hiveformat

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文