如何由于Apache Beam Java SDK中的错误而找到被拒绝的文件
我有要处理的相同类型文件的n
我将提供通配符输入模式(c:\\ users \\*\\*\\*
)。 因此,现在我如何找到文件名和记录,这些文件名和记录已被拒绝在Java中的BigQuery时。
I Have N
number of same type files to be processed and I will be giving a wildcard input pattern(C:\\users\\*\\*
).
So now how do I find the file name and record ,that has been rejected while uploading to bigquery in java.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
我猜BQ将您传递到管道而不到本地的临时位置路径(老实说不确定)。
在我的情况下,使用Python,我曾经以GCS存储桶的形式将TMP位置传递给我,当我显示错误时,它们通常显示包含命令行日志中拒绝错误的日志文件的名称。
然后我使用
gsutil cp
命令将其复制到我的本地计算机并阅读I guess BQ writes to the temp location path that you pass to your pipeline and not to local [honestly not sure about this].
In my case, with python, I used to pass tmp location as GCS bucket, and when I error is show, they usually shows the name of the log file that contains the rejected errors in the command line logs.
And then I use
gsutil cp
command to copy it to my local computer and read itBigQuery I/O(Java and Python SDK)支持致死模式:
Java
Python
BigQuery I/O (Java and Python SDK) supports deadletter pattern: https://beam.apache.org/documentation/patterns/bigqueryio/.
Java
Python