如何将 HTML 转换为 Textile?
我正在抓取一个静态 html 网站并将内容移至数据库支持的 CMS 中。 我想在 CMS 中使用 Textile。
有没有一种工具可以将 HTML 转换为 Textile,这样我就可以抓取现有网站,将 HTML 转换为 Textile,然后将该数据插入数据库?
I'm scraping a static html site and moving the content into a database-backed CMS. I'd like to use Textile in the CMS.
Is there a tool out there that converts HTML into Textile, so I can scrape the existing site, convert the HTML to Textile, and insert that data into the database?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(5)
我知道这是一个老问题,但我发现自己前几天尝试这样做,但没有找到任何有用的东西,直到我发现 潘多克。 它也可以转换大量其他标记格式——这非常出色。
I know this is an old question, but I found myself trying to do this the other day and not finding anything useful, until I found Pandoc. It can convert loads of other markup formats as well - it's quite brilliant.
这是 c# lib 转换 html 2纺织。 虽然它是带有添加剂的纺织品。 不是纯纺织物。
Here is a c# lib converting html 2 textile. Though it is textile with their additions. Not pure textile.
由于没有 JavaScript 实现,我写了一个:
https://github.com/cmroanirgo/to-textile
目前还有点原始,因为它是“to-markdown”等价物的盲端口,但应该可以完成工作。
Since there was no javascript implementation, I wrote one:
https://github.com/cmroanirgo/to-textile
It's a little primitive at the moment, as it's a blind port of the 'to-markdown' equivalent, but should get the job done.
这是一个简单的标记替换,没有什么是好的正则表达式无法修复的。
我推荐 Perl、LWP::Simple 和一些正则表达式来完成整个事情(蜘蛛、剥离设计和菜单、转换为纺织品,然后发布到数据库。)
This is a simple markup replacement, nothing a good regex could not fix.
I recommend Perl, LWP::Simple and some regexes to do the whole thing (spidering, stripping design and menus, converting to textile, and then posting to the database.)
尝试这个简单的java代码希望它对你有用
try this simple java code hope it work for you