SCWS-1.0.4 php分词模块安装
scws php分词模块
以 Linux(FreeBSD) 操作系统为例
1. 取得 scws-1.0.4 的代码
wget http://www.ftphp.com/scws/down/scws-1.0.4.tar.bz2
2. 解开压缩包
tar jxvf scws-1.0.4.tar.bz2
3. 进入目录执行配置脚本和编译
cd scws-1.0.4
./configure –prefix=/usr/local/scws
make
make install
注:这里和通用的 GNU 软件安装方式一样,具体选项参数执行 ./configure –help 查看。
常用的三个选项为:
–prefix=<scws的安装目录>
–disable-mmap <这表示禁用 MMAP 来读取 xdb,在 debian, ubuntu 的部分 Linux 中建议关闭 mmap>
–enable-developer <这表示以开发者模式编译,主要是用于调试编译时加入了 -g 选项及部分标准输出的信息>
4. 正常的话已经编译并安装成功到 /usr/local/scws 中了,执行下面命令看看文件是否存在
ls -al /usr/local/scws/lib/libscws.la
5. 试试执行 scws-cli 文件
/usr/local/scws/bin/scws -h
scws (scws-cli/1.0.4)
Simple Chinese Word Segmentation – Command line usage.
Copyright (C)2007 by hightman.
…
6 用 wget 下载并解压词典,或从主页下载然后自行解压再将 *.xdb 放入 /usr/local/scws/etc 目录中
wget http://www.ftphp.com/scws/down/scws-dict-chs-gbk.tar.bz2
tar xvjf scws-dict-chs-gbk.tar.bz2
tar jxvf scws-dict-chs-gbk.tar.bz2
cp dict.xdb /usr/local/scws/etc/
7. 这样就好顺利安装完毕可以使用 libscws 这套 C-API 了
8. 在 php 中调用分词,安装 php 扩展
1) 进入源码目录的 phpext/ 目录 ( cd ~/scws-1.0.4 )
2) 执行 phpize (在PHP安装目录的bin/目录下)
3) 执行 ./configure –with-scws=/usr/local/scws
若 php 安装在特殊目录 $php_prefix, 则请在 configure 后加上 –with-php-config=$php_prefix/bin/php-config
4) make && make install
5) 在 php.ini 中加入以下几行
[scws]
;
; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
; 再把 extension = scws.so 指定绝对路径。
;
extension = scws.so
scws.default.charset = gbk
scws.default.fpath = /usr/local/scws/etc
6) 命令行下执行 php -m 就能看到 scws 了或者在 phpinfo() 中看看关于 scws 的部分,记得要重启 web 服务器
才能使新的 php.ini 生效。