当前位置：文江博客话题详情

如何将 HTML 转换为 Textile？

发布于 2024-07-06 23:11:04 字数 149 浏览 19 评论 0原文

我正在抓取一个静态 html 网站并将内容移至数据库支持的 CMS 中。我想在 CMS 中使用 Textile。

有没有一种工具可以将 HTML 转换为 Textile，这样我就可以抓取现有网站，将 HTML 转换为 Textile，然后将该数据插入数据库？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

吝吻 2024-07-13 23:11:04

我知道这是一个老问题，但我发现自己前几天尝试这样做，但没有找到任何有用的东西，直到我发现潘多克。它也可以转换大量其他标记格式——这非常出色。

回复收藏 0 原文

动次打次papapa 2024-07-13 23:11:04

这是 c# lib 转换 html 2纺织。虽然它是带有添加剂的纺织品。不是纯纺织物。

回复收藏 0 原文

我做我的改变 2024-07-13 23:11:04

由于没有 JavaScript 实现，我写了一个：
https://github.com/cmroanirgo/to-textile

目前还有点原始，因为它是“to-markdown”等价物的盲端口，但应该可以完成工作。

回复收藏 0 原文

云淡风轻 2024-07-13 23:11:04

这是一个简单的标记替换，没有什么是好的正则表达式无法修复的。

我推荐 Perl、LWP::Simple 和一些正则表达式来完成整个事情（蜘蛛、剥离设计和菜单、转换为纺织品，然后发布到数据库。）

回复收藏 0 原文

怀念你的温柔 2024-07-13 23:11:04

尝试这个简单的java代码希望它对你有用

import java.net.*;
import java.io.*;

class Crawle
{

public static void main(String ar[])throws Exception
{


URL url = new URL("https://www.google.co.in/#q=i+am+happy");
InputStream io =  url.openStream();
BufferedReader br = new BufferedReader(new InputStreamReader(io));
FileOutputStream fio = new FileOutputStream("crawler/file.txt");
PrintWriter pr = new PrintWriter(fio,true);
String data = "";
while((data=br.readLine())!=null)
{
pr.println(data);
System.out.println(data);
}

}
}
}

try this simple java code hope it work for you

import java.net.*;
import java.io.*;

class Crawle
{

public static void main(String ar[])throws Exception
{


URL url = new URL("https://www.google.co.in/#q=i+am+happy");
InputStream io =  url.openStream();
BufferedReader br = new BufferedReader(new InputStreamReader(io));
FileOutputStream fio = new FileOutputStream("crawler/file.txt");
PrintWriter pr = new PrintWriter(fio,true);
String data = "";
while((data=br.readLine())!=null)
{
pr.println(data);
System.out.println(data);
}

}
}
}

回复收藏 0 原文

~没有更多了~

关于作者

没有心的人

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文