可以用记事本吗++ exe 在我的应用程序中?
我正在 html 敏捷包的帮助下解析 html 文件,以从 html 文件中提取表数据。但是有一些 html 文件没有可选的结束标记,或者没有可选的开始标记。因此 html 敏捷包无法正确解析该 html 页面。如果我在记事本++中打开该 html 文件的内容然后使用选项 TestFX-->TestFX HTML Tidy-->TiDy clean document
并使内容像这样整洁。现在这个文件如果我用 html 敏捷包解析那么它会正确解析它。
使用notepad++使html页面整洁是最好的选择。
所以我不知道,但用户不能这样做,就像他/她首先用记事本++使页面整洁,然后继续。那么我应该做什么?
编辑 我已经使用了 html tidy pack,但在某些情况下,有一些文件已整理,但未解析,但如果我在 notepad++ 中使此页面整洁,则它会被解析。
I am parsing html file with the help of the html agility pack to extract the table data from the html file. But there is some html files where there is no ending tags which is optional or there is no starting tag which is also optional.So html agility pack does not parse that html page properly.If I open the content of that html file in the notepad++ then with the option TestFX-->TestFX HTML Tidy-->TiDy clean document
and make the content tidy like this. And now this file If I parse with the html agility pack then it parse it properly.
Making html page tidy with notepad++ is best option.
So I don't know but user can not do this like first he/she makes the page tidy with notepad++ and then go ahead.Then what should I do ?
EDIT I have used html tidy pack but in some case there is file which is tidied with that is not parsed but if I make this page tidy in notepad++ then it is parsed.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
我认为 Notepad++ 正在使用 HtmlTidy 库,你也可以。主页位于此处。
或者也许您可以使用像 HrmlTidy online 这样的服务
编辑:您似乎想使用记事本++(在HtmlTidy)。 NP++ 有一组有限的命令选项,因此加载文件不会'这不是问题。但我找不到任何界面参考来完成您所需的其余操作:整理 HTML 并保存结果。
I think Notepad++ is using the HtmlTidy library, and so can you. The main page is here.
Or maybe you can use a service like HrmlTidy online
Edit: you seem to want to use notepad++ (on top of HtmlTidy). NP++ has a limited set of command options so loading the file won't be the problem. But I couldn't find any reference of an interface to do the rest of what you need: Tidy the HTML and Save the results.
HTML Tidy 独立于 Notepad++,您可以直接在 .NET(或其他语言)中使用这个开源组件) 项目。
有关在 .Net 中具体使用此功能的更多详细信息,请参阅此处
HTML Tidy is independent of Notepad++ and you can use this open source component directly in your .NET (or other language) project.
More details on using this in .Net specifically can be found here
HTML Tidy 也可以单独使用,并且仅用作 Notepad++ 中的插件。您可能想直接在您的应用程序中使用它。看看 http://tidy.sourceforge.net/ 。可以使用多种语言的实现。
HTML Tidy is also available separately and is just used as a plugin in Notepad++. You may want to use it directly in your app. Have a look at http://tidy.sourceforge.net/ . Implementations for many languages are available.