greenplum 外表在修改master,pg_exttable的数据字典。segment中不受影响
我创建一张外表
CREATE EXTERNAL TABLE yyw_ext(name )LOCATION ('gpfdist://10.199.111.239:8081/yyw_ext.txt')FORMAT 'text' (delimiter 't' null '\N' escape '\')
那么他会在gp的master节点和segment节点上pg_exttable字典表中都加一条记录表示外表文件的路径。
其中location字段是记录url的比如 "{gpfdist://10.199.111.239:8081/yyw_ext.txt}"
刚建立的时候。master和segment字典表都是一致的。
现在我人为的修改master节点的pg_exttable表。修改location字段使他指向新的地址 ,但是segment的地址不变。
我测试发现。外表的连接地址确实是修改之后的也确实是新的数据。但是现在segment和master的pg_exttable中的值不一致了
不知道会不会有隐藏的坑。然后虽然gpfdist协议是segment并行读取外表文件。但是从测试上来看好像就是用到了master的数据字典
没有用到segment的数据字典。那这个segment上的pg_exttable表有什么作用呢 。我表示奇怪。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
首先,我不知道为什么你需要人为地修改master节点的pg_exttable表从而导致master节点和segment节点的数据字典不一致。如果你只是想让external table指向新的位置,你完成可以drop掉旧的external table,然后创建一个名字一样的新的external table,但指向新的位置。
其次,从实现代码看,如你测试的结果所示,gpfdist协议的外部表执行的时候使用的是master节点的数据字典,location的信息通过查询计划分发到segment节点。换句话说,在正常的查询中,gpfdist协议的外部表没有用到segment的数据字典。但是,Greenplum Database有一种模式叫utility模式。用户是可以通过utility模式直接连接到segment节点,然后在segment节点上面执行查询。在这种情况下,如果需要访问gpfdist协议的外部表,那么使用的将是segment的数据字典(也就是segment的pg_exttable中的location信息)。因为utility模式下,每个segment就是一个单独的postgresql数据库,它不会去访问,也不能去访问master的数据字典。
最后,结论就是:(1)你不应该人为地去修改master节点的pg_exttable表;(2)正常情况下,对于gpfdist协议的外部表,即便master和segment的pg_exttable信息不一致,对查询结果也不会有任何影响;但在utility模式下,在master上访问同样的external table,和在segment上访问同样的external table,结果可能会不一样。