返回介绍

Pig Dump 运算符

发布于 2024-06-23 16:54:49 字数 6782 浏览 0 评论 0 收藏 0

Dump 运算符,也就是诊断运算符。

load 语句将简单地将数据加载到Apache pig 指定的关系。要验证Load语句的执行,您必须使用Diagnostic(诊断)操作符。Pig Latin提供四种不同类型的诊断运算符:

  • Dump 运算符
  • Describe 运算符
  • Explanation 运算符
  • Illustration 运算符

在本章中,我们将讨论Pig Latin的Dump运算符。

Dump 运算符

Dump 操作来运行的Pig Latin语句并在屏幕上显示的结果。它通常用于调试目的。

语法

下面给出的是Dump运算符的语法。

  1. grunt> Dump Relation_Name

假设我们在HDFS中有一个具有以下内容的文件Student_data.txt。

  1. 001,Rajiv,Reddy,9848022337,Hyderabad
  2. 002,siddarth,Battacharya,9848022338,Kolkata
  3. 003,Rajesh,Khanna,9848022339,Delhi
  4. 004,Preethi,Agarwal,9848022330,Pune
  5. 005,Trupthi,Mohanthy,9848022336,Bhuwaneshwar
  6. 006,Archana,Mishra,9848022335,Chennai.

如下所示,我们已使用LOAD运算符将其读入关系学生。

  1. grunt> student = LOAD 'hdfs://localhost:9000/pig_data/student_data.txt'
  2. USING PigStorage(',')
  3. as ( id:int, firstname:chararray, lastname:chararray, phone:chararray,city:chararray );

现在,让我们使用Dump运算符打印关系的内容,如下所示。

  1. grunt> Dump student

一旦执行了上述Pig Latin语句,它将启动MapReduce作业以从HDFS读取数据。它将产生以下输出。

  1. 2020-10-01 15:05:27,642 [main]
  2. INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher -
  3. 100% complete
  4. 2020-10-01 15:05:27,652 [main]
  5. INFO org.apache.pig.tools.pigstats.mapreduce.SimplePigStats - Script Statistics:
  6. HadoopVersion PigVersion UserId StartedAt FinishedAt Features
  7. 2.6.0 0.15.0 Hadoop 2020-10-01 15:03:11 2020-10-01 05:27 UNKNOWN
  8. Success!
  9. Job Stats (time in seconds):
  10. JobId job_14459_0004
  11. Maps 1
  12. Reduces 0
  13. MaxMapTime n/a
  14. MinMapTime n/a
  15. AvgMapTime n/a
  16. MedianMapTime n/a
  17. MaxReduceTime 0
  18. MinReduceTime 0
  19. AvgReduceTime 0
  20. MedianReducetime 0
  21. Alias student
  22. Feature MAP_ONLY
  23. Outputs hdfs://localhost:9000/tmp/temp580182027/tmp757878456,
  24. Input(s): Successfully read 0 records from: "hdfs://localhost:9000/pig_data/
  25. student_data.txt"
  26. Output(s): Successfully stored 0 records in: "hdfs://localhost:9000/tmp/temp580182027/
  27. tmp757878456"
  28. Counters: Total records written : 0 Total bytes written : 0 Spillable Memory Manager
  29. spill count : 0Total bags proactively spilled: 0 Total records proactively spilled: 0
  30. Job DAG: job_1443519499159_0004
  31. 2020-10-01 15:06:28,403 [main]
  32. INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLau ncher - Success!
  33. 2020-10-01 15:06:28,441 [main] INFO org.apache.pig.data.SchemaTupleBackend -
  34. Key [pig.schematuple] was not set... will not generate code.
  35. 2020-10-01 15:06:28,485 [main]
  36. INFO org.apache.hadoop.mapreduce.lib.input.FileInputFormat - Total input paths
  37. to process : 1
  38. 2020-10-01 15:06:28,485 [main]
  39. INFO org.apache.pig.backend.hadoop.executionengine.util.MapRedUtil - Total input paths
  40. to process : 1
  41. (1,Rajiv,Reddy,9848022337,Hyderabad)
  42. (2,siddarth,Battacharya,9848022338,Kolkata)
  43. (3,Rajesh,Khanna,9848022339,Delhi)
  44. (4,Preethi,Agarwal,9848022330,Pune)
  45. (5,Trupthi,Mohanthy,9848022336,Bhuwaneshwar)
  46. (6,Archana,Mishra,9848022335,Chennai)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文