PHP - BBCode 解析器 - 解析 bbcode 链接标记和未标记的链接

发布于 2024-09-09 00:59:10 字数 1352 浏览 8 评论 0原文

我需要这样做:

当用户插入 BBCode 标签时,使用 preg_replace 和正则表达式我会进行一些转换。

例如,

function forumBBCode($str){
   $format_search=array(
      '#\[url=(.*?)\](.*?)\[/url\]#i'
   );

   $format_replace=array(
      '<a class="lforum" target="_blank" href="$1">$2</a>'
   );

   $str=preg_replace($format_search, $format_replace, $str);
   $str=nl2br($str);
   return $str;
}

现在我也想要这个:当用户插入带有链接的普通文本时,它也必须被转换。我无法使用 preg_replace 函数执行此操作,因为如果我编写代码,

$format_search
'#(www\..*?)#i'

$format_replace
'<a class="lforum" target="_blank" href="$1">$1</a>'

它将转换链接两次(在 [url] 中以及当链接没有此标记时)。

所以我认为这个函数:

    function checkLinks($string) {
    $arrelab="";
    $arr=split(' |\r\n', $string);
    for($i=0; $i<sizeof($arr); $i++) {
        echo $i." - ".$arr[$i]."<br/>";
        if ((strpos($arr[$i], 'www.')!==false) or (strpos($arr[$i], 'http://')!==false) or (strpos($arr[$i], 'ftp://')!==false)) {
            if (strpos($arr[$i], '[url=')===false) {
                $arr[$i]='<a class="lforum" target="_blank" href="'.$arr[$i].'">'.$arr[$i].'</a>';
            }
        }

        $arrelab=$arrelab." ".$arr[$i];
    }
    return $arrelab;
}

问题是我需要对换行符和空白空间进行分割。 任何帮助将不胜感激。

PS 抱歉我的英语不好:)

干杯

I need to do this :

when a user insert a BBCode tag, with preg_replace and regex i do some trasformation.

e.g.

function forumBBCode($str){
   $format_search=array(
      '#\[url=(.*?)\](.*?)\[/url\]#i'
   );

   $format_replace=array(
      '<a class="lforum" target="_blank" href="$1">$2</a>'
   );

   $str=preg_replace($format_search, $format_replace, $str);
   $str=nl2br($str);
   return $str;
}

now i want also this : when a user insert a normal text with a link, this must be trasformed too. i can't do this trought preg_replace function, because if i write a code as

$format_search
'#(www\..*?)#i'

$format_replace
'<a class="lforum" target="_blank" href="$1">$1</a>'

it will convert the link 2 time (in the [url] and when the link is without this tag).

so i think to this function :

    function checkLinks($string) {
    $arrelab="";
    $arr=split(' |\r\n', $string);
    for($i=0; $i<sizeof($arr); $i++) {
        echo $i." - ".$arr[$i]."<br/>";
        if ((strpos($arr[$i], 'www.')!==false) or (strpos($arr[$i], 'http://')!==false) or (strpos($arr[$i], 'ftp://')!==false)) {
            if (strpos($arr[$i], '[url=')===false) {
                $arr[$i]='<a class="lforum" target="_blank" href="'.$arr[$i].'">'.$arr[$i].'</a>';
            }
        }

        $arrelab=$arrelab." ".$arr[$i];
    }
    return $arrelab;
}

the problem is that i need a split as for the newline, as for the empty space.
any help would be appreciated.

p.s. sorry for my bad english :)

cheers

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

止于盛夏 2024-09-16 00:59:10

使用lookbehind断言很容易解决这个问题。

preg_replace('#(?<![>/"])((http://)?www.........)#im', '<a href="$1">$1</a>'

因此,正则表达式将跳过任何包含在 " 或 > 中或以 /
开头的 URL
这是一种解决方法,而不是解决方案。

PS:target="_blank"是用户纠缠。把它剪掉。

It's easy to workaround with a lookbehind assertion.

preg_replace('#(?<![>/"])((http://)?www.........)#im', '<a href="$1">$1</a>'

Thus the regex will skip any URL enclosed in " or > or preceeded by /
It's a workaround, not a solution.

PS: target="_blank" is user pestering. Cut it out.

故人的歌 2024-09-16 00:59:10

最简单的选择是首先解析纯文本 URL,并确保它们不会紧跟在等号之后。

马里奥斯更新:

preg_replace('#(?/"])(((http|https|ftp)://)?www[a-zA-Z0-9\-_\ .]+)#im', '$1'

The easiest option would be to parse the plain-text urls first and ensure they don't come immediately after an equals sign.

Update from Marios:

preg_replace('#(?<![>/"])(((http|https|ftp)://)?www[a-zA-Z0-9\-_\.]+)#im', '<a href="$1">$1</a>'

零時差 2024-09-16 00:59:10

通过阅读标题可以确定您的问题。解析正则表达式结合使用

您无法使用正则表达式“解析”html或bb代码,因为它们不是常规语言。

您应该编写(或找到)一个 bb 代码解析器,而不是使用正则表达式。

Google 关于 BB 代码解析器的第一个结果是NBBC:新的 BBCode 解析器。但我从未使用过它,所以我无法评论它的质量。

Your problem can be identified by reading your title.. parsing in combination with regex

You can't 'parse' html or bb-code with a regular expression because they are not regular languages.

You should write (or find) a bb-code parser instead of using regular expressions.

Google's first result for a BB-code parser is NBBC: The New BBCode Parser. But I've never used it so I can't comment on the quality.

尬尬 2024-09-16 00:59:10

有一种更简单的方法可以做到这一点。我在 RedBonzai 开发者博客中创建了一个演练。它的链接在这里: http://www.redbonzai.com/blog/web-development/how-to-create-a-bb-codes-function-in-php/

如果您有任何疑问,请告诉我。

红盆栽

There is an easier way to do this. I have created a walk through in the RedBonzai Developers blog. The link to it is here: http://www.redbonzai.com/blog/web-development/how-to-create-a-bb-codes-function-in-php/

Let me know if you have any questions.

RedBonzai

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文