crf++是一款非常常用的變成開源工具,主要用于文本標注、分詞等等,用戶可以非常輕松的的完成各種變成任務。目前,crf++是國內最實用的一款軟件,深受廣大程序員們的喜愛。還在等什么!快來旋風軟件園下載吧!
doc文件夾:就是官方主頁的內容
example文件夾:有四個任務的訓練數(shù)據(test.data)、測試數(shù)據(train.data)和模板文件(template),還有一個執(zhí)行腳本文件exec.sh。
libcrffpp.dll:訓練程序和測試程序需要使用的靜態(tài)鏈接庫。
clr_learn.exe:crf++的訓練程序
crl_test.exe:crf++的測試程序
sdk文件夾:crf++的頭文件和靜態(tài)鏈接庫。
條件隨機場(crf)由lafferty等人于2001年提出,結合了最大熵模型和隱馬爾可夫模型的特點,是一種無向圖模型,近年來在分詞、詞性標注和命名實體識別等序列標注任務中取得了很好的效果。條件隨機場是一個典型的判別式模型,其聯(lián)合概率可以寫成若干勢函數(shù)聯(lián)乘的形式,其中最常用的是線性鏈條件隨機場。若讓x=(x1,x2,…xn)表示被觀察的輸入數(shù)據序列,y=(y1,y2,…yn)表示一個狀態(tài)序列,在給定一個輸入序列的情況下,線性鏈的crf模型定義狀態(tài)序列的聯(lián)合條件概率為
p(y|x)=exp{} (2-14)
z(x)={} (2-15)
其中:z是以觀察序列x為條件的概率歸一化因子;fj(yi-1,yi,x,i)是一個任意的特征函數(shù);是每個特征函數(shù)的權值。
1、解壓后將crf_learn.exe crf_test.exe libcrfpp.dll文件復制到example文件夾的任意文件夾下
2、打開cmd命令行模式cd到1中目錄。
3、輸入指令crf_learn template train.data model即可生成model文件
大小:166.00M / 版本:v0.58 官方版
大?。?3.35M / 版本:v0.58 官方版
大小:78.17M / 版本:v0.58 官方版
大?。?.84M / 版本:v0.58 官方版
大小:34.58M / 版本:v0.58 官方版
大?。?.03M / 版本:v0.58 官方版
大小:891.00M / 版本:v0.58 官方版
大?。?0.40M / 版本:v0.58 官方版
大小:46.56M / 版本:v0.58 官方版
大?。?27.69M / 版本:v0.58 官方版
大?。?66.78M / 版本:v0.58 官方版
大?。?.48M / 版本:v0.58 官方版