如何将 HTML 转换为 Textile?

发布于 2024-07-06 23:11:04 字数 149 浏览 10 评论 0原文

我正在抓取一个静态 html 网站并将内容移至数据库支持的 CMS 中。 我想在 CMS 中使用 Textile。

有没有一种工具可以将 HTML 转换为 Textile,这样我就可以抓取现有网站,将 HTML 转换为 Textile,然后将该数据插入数据库?

I'm scraping a static html site and moving the content into a database-backed CMS. I'd like to use Textile in the CMS.

Is there a tool out there that converts HTML into Textile, so I can scrape the existing site, convert the HTML to Textile, and insert that data into the database?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(5

吝吻 2024-07-13 23:11:04

我知道这是一个老问题,但我发现自己前几天尝试这样做,但没有找到任何有用的东西,直到我发现 潘多克。 它也可以转换大量其他标记格式——这非常出色。

I know this is an old question, but I found myself trying to do this the other day and not finding anything useful, until I found Pandoc. It can convert loads of other markup formats as well - it's quite brilliant.

动次打次papapa 2024-07-13 23:11:04

这是 c# lib 转换 html 2纺织。 虽然它是带有添加剂的纺织品。 不是纯纺织物。

Here is a c# lib converting html 2 textile. Though it is textile with their additions. Not pure textile.

我做我的改变 2024-07-13 23:11:04

由于没有 JavaScript 实现,我写了一个:
https://github.com/cmroanirgo/to-textile

目前还有点原始,因为它是“to-markdown”等价物的盲端口,但应该可以完成工作。

Since there was no javascript implementation, I wrote one:
https://github.com/cmroanirgo/to-textile

It's a little primitive at the moment, as it's a blind port of the 'to-markdown' equivalent, but should get the job done.

云淡风轻 2024-07-13 23:11:04

这是一个简单的标记替换,没有什么是好的正则表达式无法修复的。

我推荐 Perl、LWP::Simple 和一些正则表达式来完成整个事情(蜘蛛、剥离设计和菜单、转换为纺织品,然后发布到数据库。)

This is a simple markup replacement, nothing a good regex could not fix.

I recommend Perl, LWP::Simple and some regexes to do the whole thing (spidering, stripping design and menus, converting to textile, and then posting to the database.)

怀念你的温柔 2024-07-13 23:11:04

尝试这个简单的java代码希望它对你有用

import java.net.*;
import java.io.*;

class Crawle
{

public static void main(String ar[])throws Exception
{


URL url = new URL("https://www.google.co.in/#q=i+am+happy");
InputStream io =  url.openStream();
BufferedReader br = new BufferedReader(new InputStreamReader(io));
FileOutputStream fio = new FileOutputStream("crawler/file.txt");
PrintWriter pr = new PrintWriter(fio,true);
String data = "";
while((data=br.readLine())!=null)
{
pr.println(data);
System.out.println(data);
}

}
}
}

try this simple java code hope it work for you

import java.net.*;
import java.io.*;

class Crawle
{

public static void main(String ar[])throws Exception
{


URL url = new URL("https://www.google.co.in/#q=i+am+happy");
InputStream io =  url.openStream();
BufferedReader br = new BufferedReader(new InputStreamReader(io));
FileOutputStream fio = new FileOutputStream("crawler/file.txt");
PrintWriter pr = new PrintWriter(fio,true);
String data = "";
while((data=br.readLine())!=null)
{
pr.println(data);
System.out.println(data);
}

}
}
}
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文