我在找php中文切分
因为中文单词没有空格,所以影响全文搜索。
例如。
$_GET['text']="中文分詞搜尋";
$text=$_GET['text'];(user's input)
$text; -chinese segment function-> $text="中文 分詞 搜尋";(result)发布于 2014-03-17 03:03:12
如果你问谷歌,找到这样的库是非常容易的。
为了保证性能,内核算法主要是用C/C++等本地语言实现的。
还有一个是基于RESTful api (带有php接口)的:
纯php实现(可能是缓慢的):
一个在线web服务,带有php客户端驱动程序。
发布于 2014-03-17 03:00:41
尝试:
<?php
$str = '蚂蚁学院,欢迎您的光临!';
function mbstringtoarray($str,$charset) {
$strlen=mb_strlen($str);
while($strlen){
$array[]=mb_substr($str,0,1,$charset);
$str=mb_substr($str,1,$strlen,$charset);
$strlen=mb_strlen($str);
}
return $array;
}
$arr = mbstringtoarray($str,"gbk");
print_r($arr);
?> 产出如下:
Array
(
[0] => 蚂
[1] => 蚁
[2] => 学
[3] => 院
[4] => ,
[5] => 欢
[6] => 迎
[7] => 您
[8] => 的
[9] => 光
[10] => 临
[11] => !
)你不能一字一句地把它分开:蚂蚁/学院/欢迎/您/的/光临
如果坚持,您将需要另一个表来存储这些含义完整的单词,因为php默认不会识别它。
https://stackoverflow.com/questions/22445871
复制相似问题