找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 1544|回复: 3

[字符串] (XD::String:GetWords)英汉分词

[复制链接]

已领礼包: 145个

财富等级: 日进斗金

发表于 2016-5-3 16:39:15 | 显示全部楼层 |阅读模式
函数发布
函数名称: XD::String:GetWords
调用格式: (XD::String:GetWords str mode)
参数说明: str --- string
mode-- t 单独的汉字和连续的英文
nil--连续的汉字和连续的英文
返回值: 字符串表
函数简介: 返回连续的英文和汉字组成的表(英汉分词)
函数来源: 原创
函数作者: XDSoft
适用版本: XDRX API 
最后更新时间: 2016-05-03
备注: 命令: (XD::STRING:GETWORDS "曉東CAD" t)
("曉" "東" "CAD")
命令: (XD::STRING:GETWORDS "曉東CAD" nil)
("曉東" "CAD")
演示图片: -

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
  1. (defun XD::String:GetWords (str mode / cm i str1 strl)  (setq cm "[\\u4e00-\\u9fa5]")
  2.   (cond
  3.     ((xdrx_string_regexps (strcat "^" cm) str)
  4.       (setq cm "[\\u4e00-\\u9fa5]+")
  5.       (setq i 0)
  6.       (while (setq str1 (xdrx_string_regexps cm str t))
  7.         (if (= (rem i 2) 0)
  8.           (progn
  9.             (setq cm "[^\\u4e00-\\u9fa5]+")
  10.             (if (= mode t)
  11.               (setq str1 (reverse (XD::String:RegExpS "[\\u4e00-\\u9fa5]"
  12.                                                       str1 ""
  13.                                   )
  14.                          )
  15.               )
  16.               (setq str1 (list str1))
  17.             )
  18.           )
  19.           (progn
  20.             (setq cm "[\\u4e00-\\u9fa5]+")
  21.             (setq str1 (list str1))
  22.           )
  23.         )
  24.         (setq i (1+ i))
  25.         (setq strl (append
  26.                      str1
  27.                      strl
  28.                    )
  29.         )
  30.       )
  31.     )
  32.     (t
  33.       (setq cm "[^\\u4e00-\\u9fa5]+")
  34.       (setq i 0)
  35.       (while (setq str1 (xdrx_string_regexps cm str t))
  36.         (if (= (rem i 2) 0)
  37.           (progn
  38.             (setq cm "[\\u4e00-\\u9fa5]+")
  39.             (setq str1 (list str1))
  40.           )
  41.           (progn
  42.             (setq cm "[^\\u4e00-\\u9fa5]+")
  43.             (if (= mode t)
  44.               (setq str1 (reverse (XD::String:RegExpS "[\\u4e00-\\u9fa5]"
  45.                                                       str1 ""
  46.                                   )
  47.                          )
  48.               )
  49.               (setq str1 (list str1))
  50.             )
  51.           )
  52.         )
  53.         (setq i (1+ i))
  54.         (setq strl (append
  55.                      str1
  56.                      strl
  57.                    )
  58.         )
  59.       )
  60.     )
  61.   )
  62.   (reverse strl)
  63. )


论坛插件加载方法
发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;
如果你在论坛求助问题,并且已经从坛友或者管理的回复中解决了问题,请把帖子标题加上【已解决】;
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【D豆】,加分不会扣除自己的积分,做一个热心并受欢迎的人!

已领礼包: 604个

财富等级: 财运亨通

发表于 2016-5-3 21:39:56 来自手机 | 显示全部楼层
老大,来个输入输出示例吧!

点评

上面的备注里面不是有例子嘛 命令: (XD::STRING:GETWORDS "曉東CAD" t) ("曉" "東" "CAD") 命令: (XD::STRING:GETWORDS "曉東CAD" nil) ("曉東" "CAD")  详情 回复 发表于 2016-5-3 22:36
论坛插件加载方法
发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;
如果你在论坛求助问题,并且已经从坛友或者管理的回复中解决了问题,请把帖子标题加上【已解决】;
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【D豆】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 支持 反对

使用道具 举报

已领礼包: 40个

财富等级: 招财进宝

发表于 2016-5-3 22:36:44 | 显示全部楼层
/db_自贡黄明儒_ 发表于 2016-5-3 21:39
老大,来个输入输出示例吧!

上面的备注里面不是有例子嘛

命令: (XD::STRING:GETWORDS "曉東CAD" t)
("曉" "東" "CAD")
命令: (XD::STRING:GETWORDS "曉東CAD" nil)
("曉東" "CAD")
论坛插件加载方法
发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;
如果你在论坛求助问题,并且已经从坛友或者管理的回复中解决了问题,请把帖子标题加上【已解决】;
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【D豆】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 支持 反对

使用道具 举报

已领礼包: 604个

财富等级: 财运亨通

发表于 2016-5-12 21:28:11 来自手机 | 显示全部楼层
newer 发表于 2016-5-3 22:36
上面的备注里面不是有例子嘛

命令: (XD::STRING:GETWORDS "曉東CAD" t)

于机上看不到那些备注
论坛插件加载方法
发帖求助前要善用【论坛搜索】功能,那里可能会有你要找的答案;
如果你在论坛求助问题,并且已经从坛友或者管理的回复中解决了问题,请把帖子标题加上【已解决】;
如何回报帮助你解决问题的坛友,一个好办法就是给对方加【D豆】,加分不会扣除自己的积分,做一个热心并受欢迎的人!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|申请友链|Archiver|手机版|小黑屋|辽公网安备|晓东CAD家园 ( 辽ICP备15016793号 )

GMT+8, 2024-4-26 16:48 , Processed in 0.421072 second(s), 37 queries , Gzip On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表