高维向量的空间表示
我用gensim训练了个模型,然后model[list[i]]拿到了语料库list的向量表示,是300多万个200维向量,我希望把他们的分布表示出来,就做一个类似可视化的东西,是不是必须要做降维处理,以及降维处理的方式
再插一句顺便请教好看的画图库,之前用igraph画了个社交关系的图感觉浓浓的上个世纪的风格,求助攻~
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
这几天试着做了做,sklearn效率跟不上,低维小数据运行无误,但是这个就会卡死然后自己kill掉,需要加内存。去v2上问的一个比较好的解决办法是计算向量范数,然后排序,投影排序靠前的,就酱。
降维可视化可以用T-SNE, sklearn库中可以直接调sklearn.manifold.TSNE