javascript中的截断单词函数（研究dojo的代码）

发布于 2024-07-24 02:27:29 字数 1342 浏览 3 评论 0原文

“截断单词”将采用一串单词并仅返回前 10 个单词。

在dojo（javascript库）中他们有这样一个函数，其代码是这样的：

truncatewords: function(value, arg){
    // summary: Truncates a string after a certain number of words
   // arg: Integer
   //              Number of words to truncate after
   arg = parseInt(arg);
   if(!arg){
           return value;
   }

   for(var i = 0, j = value.length, count = 0, current, last; i < value.length; i++){
           current = value.charAt(i);
           if(dojox.dtl.filter.strings._truncatewords.test(last)){
                   if(!dojox.dtl.filter.strings._truncatewords.test(current)){
                           ++count;
                           if(count == arg){
                                   return value.substring(0, j + 1);
                           }
                   }
           }else if(!dojox.dtl.filter.strings._truncatewords.test(current)){
                   j = i;
           }
           last = current;
   }
   return value;
}

其中dojox.dtl.filter.strings._truncatewords.是/(&.*?;|< .*?>|(\w[\w-]*))/g

为什么不这样写：

function truncate(value,arg) {
    var value_arr = value.split(' ');
    if(arg < value_arr.length) {
        value = value_arr.slice(0,arg).join(' '); }
    return value;
}

有什么区别？

原文

A 'truncate words' would take a string of words and return only the first, let's say, 10 words.

In dojo (javascript library) they have such a function, whose code is this:

truncatewords: function(value, arg){
    // summary: Truncates a string after a certain number of words
   // arg: Integer
   //              Number of words to truncate after
   arg = parseInt(arg);
   if(!arg){
           return value;
   }

   for(var i = 0, j = value.length, count = 0, current, last; i < value.length; i++){
           current = value.charAt(i);
           if(dojox.dtl.filter.strings._truncatewords.test(last)){
                   if(!dojox.dtl.filter.strings._truncatewords.test(current)){
                           ++count;
                           if(count == arg){
                                   return value.substring(0, j + 1);
                           }
                   }
           }else if(!dojox.dtl.filter.strings._truncatewords.test(current)){
                   j = i;
           }
           last = current;
   }
   return value;
}

where dojox.dtl.filter.strings._truncatewords. is /(&.*?;|<.*?>|(\w[\w-]*))/g

Why isn't this written like so:

function truncate(value,arg) {
    var value_arr = value.split(' ');
    if(arg < value_arr.length) {
        value = value_arr.slice(0,arg).join(' '); }
    return value;
}

and what are the differences?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

埋情葬爱 2024-07-31 02:27:29

您的分割应考虑到任何空白字符序列都是单词分隔符。您应该按照 \s+ 之类的正则表达式进行拆分。

但除此之外，dojo 的代码似乎也将实体和 xml 标签作为单词。如果您知道字符串中没有这样的东西，那么您的实现可能会成功。请注意，您的切片不会超出找到的单词数，这可能需要进行一些检查。

回复收藏 0 原文

墨落成白 2024-07-31 02:27:29

您正在查看的代码来自 dtl 库，该库用于支持 django 模板语言。 (http://www.dojotoolkit .org/book/dojo-book-0-9/part-5-dojox/dojox-dtl）。我确信其中的代码不仅仅是进行直接字符串分割，而是解析他们正在使用的模板。

另外，看看该正则表达式，他们处理的场景不仅仅是空格......例如，<.*？> 将导致开始和结束标记中包含的任何单词组被视为“单词”。

回复收藏 0 原文

鸠书 2024-07-31 02:27:29

function 声明：这可能是一个 javascript 对象，使用 function_name: function(params) {... 有助于使 javascript 脱离全局范围。
通过检查 arg 变量，他们确保传递了一个整数。使用 parseInt() 将允许 10 和 "10" 被接受。
此方法可以通过所使用的正则表达式处理比空格更多的分隔符。
此代码对于数组溢出是安全的。如果 value 中只有 8 个单词，您就无法数到 10。否则，您会得到数组越界或对象不存在错误。