lustre:如何选择监听哪一块网卡
大家好,我是Lustre新手,向大家请教一些问题。
我装的1.4.10版lustre,我的OST主机启动成功了,但是在MDS上启动时:
启动MDS:
- # lconf --node lustre-mds config.xml
- loading module: libcfs srcdir None devdir libcfs
- loading module: lnet srcdir None devdir lnet
- loading module: ksocklnd srcdir None devdir klnds/socklnd
- loading module: lvfs srcdir None devdir lvfs
- loading module: obdclass srcdir None devdir obdclass
- loading module: ptlrpc srcdir None devdir ptlrpc
- loading module: mdc srcdir None devdir mdc
- loading module: osc srcdir None devdir osc
- loading module: lov srcdir None devdir lov
- loading module: mds srcdir None devdir mds
- loading module: ldiskfs srcdir None devdir ldiskfs
- loading module: fsfilt_ldiskfs srcdir None devdir lvfs
- NETWORK: NET_lustre-mds_tcp NET_lustre-mds_tcp_UUID tcp lustre-mds
- MDSDEV: mds-test mds-test_UUID /dev/sda9 ldiskfs 0 no
- MDS mount options: errors=remount-ro
- 一直停在这里不动了
复制代码
MDS端log显示:
- Apr 27 18:38:38 mob24 kernel: LDISKFS-fs: mounted filesystem with ordered data mode.
- Apr 27 18:38:38 mob24 kernel: LustreError: 4196:0:(socklnd_cb.c:2160:ksocknal_recv_hello()) Error -104 reading HELLO from 192.168.4.182
- Apr 27 18:38:38 mob24 kernel: LustreError: Connection to 192.168.4.182@tcp at host 192.168.4.182 on port 988 was reset: is it running a compatible version of Lustre and is 192.168.4.182@tcp one of its NIDs?
- Apr 27 18:38:38 mob24 kernel: Lustre: 12:0:(linux-debug.c:98:libcfs_run_upcall()) Invoked LNET upcall /usr/lib/lustre/lnet_upcall ROUTER_NOTIFY,192.168.4.182@tcp,down,1177669950
复制代码
且MDS一直尝试连接OST,但OST端log显示拒绝:
- Apr 27 18:37:53 mob25 kernel: LustreError: Refusing connection from 192.168.4.181 for 192.168.4.182@tcp: No matching NI
复制代码
为什么NI不匹配呢?NI是不是就是NID啊??我的脚本有问题?:
- #!/bin/bash
- # Create node
- rm -rf config.xml
- lmc -m config.xml --add node --node lustre-mds
- lmc -m config.xml --add node --node lustre-ost
- lmc -m config.xml --add node --node lustre-client
- lmc -m config.xml --add net --node lustre-mds --nid lustre-mds --nettype tcp
- lmc -m config.xml --add net --node lustre-ost --nid lustre-ost --nettype tcp
- lmc -m config.xml --add net --node lustre-client --nid '*' --nettype tcp
- # Configure MDS
- lmc -m config.xml --add mds --node lustre-mds --mds mds-test --fstype ext3 --dev /dev/sda9
- # Configure LOV
- lmc -m config.xml --add lov --lov lov-test --mds mds-test --stripe_sz 1048576 --stripe_cnt 0 --stripe_pattern 0
- # Configure OSTs
- lmc -m config.xml --add ost --node lustre-ost --lov lov-test --ost ost1-test --fstype ext3 --dev /dev/sda9
- # Configure CLIENTs
- lmc -m config.xml --add mtpt --node lustre-client --path /mnt/lustre --mds mds-test --lov lov-test
复制代码
希望得到指教。。。多谢了。。。。!
[ 本帖最后由 sealinger 于 2007-6-21 09:56 编辑 ]
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(8)
发现问题原因:
我用三台机器做测试,mds,ost,client,每台机器都有两块网卡,但ost启动只监听eth0的公网IP,而我在hosts文件中配置的是指向eth1内网IP的,所以不能连接 192.168.4.182@tcp ,OST启动后:
复制代码
尝试更改/etc/modeprobe.conf文件为:
复制代码
重启系统,重启OST,还是只监听1**.*1.4.1**@tcp 公网IP这个。。。
请教大侠该如何让lustre监听第2块网卡IP?
请大家能帮我解释一下下图的意思吗?
[ 本帖最后由 sealinger 于 2007-4-28 12:44 编辑 ]
没用过1.4的
options lnet networks=tcp试试看可以可以Listen到所有的ip
关闭iptables和ip6tables和selinux
我也遇到了同样的问题,按楼上的方法试了也不行,还有其他的办法吗,谢谢
使用这个配置依然只监听第1块网卡!
大家还有其他办法吗??
你可以加到group156812@xiaoi.com 问问里面的人
晕 ,楼上是广告吧。。。
大家帮忙啊···
1是楼上得说得关掉selinux,解决不能连得问题
2是改成tcp1,解决监听eth0得问题