您當前的位置 - 首頁編程開發(fā)編程工具 → python crf中文分詞(crf++工具) v0.58 官方版

python crf中文分詞(crf++工具)

v0.58 官方版
python crf中文分詞(crf++工具)
  • 軟件大?。?span>434KB
  • 軟件類別:編程開發(fā) / 編程工具
  • 軟件語言:簡體中文
  • 推薦等級:4星
  • 授權方式:免費軟件
  • 更新時間:2020-02-07 11:19
  • 運行平臺:WinXP, Win7, Win8, Win10
  • 相關鏈接:暫無
好評:50%頂一個
壞評:50%踩一個
  • 軟件介紹
軟件標簽: crf++ python 編程工具

crf++是一款非常常用的變成開源工具,主要用于文本標注、分詞等等,用戶可以非常輕松的的完成各種變成任務。目前,crf++是國內最實用的一款軟件,深受廣大程序員們的喜愛。還在等什么!快來旋風軟件園下載吧!

crf++軟件內容

doc文件夾:就是官方主頁的內容

example文件夾:有四個任務的訓練數(shù)據(test.data)、測試數(shù)據(train.data)和模板文件(template),還有一個執(zhí)行腳本文件exec.sh。

libcrffpp.dll:訓練程序和測試程序需要使用的靜態(tài)鏈接庫。

clr_learn.exe:crf++的訓練程序

crl_test.exe:crf++的測試程序

sdk文件夾:crf++的頭文件和靜態(tài)鏈接庫。

crf++最新版下載

相關介紹

條件隨機場(crf)由lafferty等人于2001年提出,結合了最大熵模型和隱馬爾可夫模型的特點,是一種無向圖模型,近年來在分詞、詞性標注和命名實體識別等序列標注任務中取得了很好的效果。條件隨機場是一個典型的判別式模型,其聯(lián)合概率可以寫成若干勢函數(shù)聯(lián)乘的形式,其中最常用的是線性鏈條件隨機場。若讓x=(x1,x2,…xn)表示被觀察的輸入數(shù)據序列,y=(y1,y2,…yn)表示一個狀態(tài)序列,在給定一個輸入序列的情況下,線性鏈的crf模型定義狀態(tài)序列的聯(lián)合條件概率為

p(y|x)=exp{} (2-14)

z(x)={} (2-15)

其中:z是以觀察序列x為條件的概率歸一化因子;fj(yi-1,yi,x,i)是一個任意的特征函數(shù);是每個特征函數(shù)的權值。

使用方法

1、解壓后將crf_learn.exe crf_test.exe libcrfpp.dll文件復制到example文件夾的任意文件夾下

2、打開cmd命令行模式cd到1中目錄。

3、輸入指令crf_learn template train.data model即可生成model文件

預覽截圖
下載地址
最新更新
軟件評論

熱門評論

最新評論

發(fā)表評論 查看所有評論

昵稱:
請不要評論無意義或臟話,我們所有評論會有人工審核.
字數(shù): 0/500 (您的評論需要經過審核才能顯示)
推薦軟件