sparksql操作csv排序时如何进行Int类型的排序, 而不是String类型的排序
Dataset<Row> df = spark.read().format("csv").load("C:\\develop\\intellij-workspace\\SparkSqlDemos\\resources\\down.csv");
df.createOrReplaceTempView("down");
Dataset<Row> dfSQL = spark.sql("SELECT * FROM down order by _c3");
//无法使用CAST关键字
//Dataset<Row> dfSQL = spark.sql("SELECT * FROM down order by CAST(_c3 as SIGNED)");
如何实现按照Int类型排序
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
见: org.apache.spark.sql.DataFrameReader 文档, 通过修改option方法中的inferSchema选项为true, 推到数据类型为数值, 而不是一律默认为String