免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
打造自己詞庫(kù)之初級(jí)篇[五筆愛(ài)好者]

 用輸入法,不論使用極點(diǎn)、酷極、萬(wàn)能、智能等哪一款五筆,都有一個(gè)打造最適合自己詞庫(kù)的過(guò)程。本文目的,在于教你掌握基本的文本處理方法。  有朋友問(wèn)了,有極點(diǎn)工具箱,還需要自己手工處理么? 我的回答是: 極點(diǎn)工具箱是不透明處理,你并不清楚它是怎么工作的,你原來(lái)的字、詞頻是否得到保留。 而我教你的方法,讓你清清楚楚的明白自己所做的,字、詞頻也不會(huì)變化,保證百分百原版移植。

一、工欲善其事,必先利其器。 先下載自己要用到的文本處理工具。
以下兩種都是很優(yōu)秀的文本處理工具。 Emeditor勝在功能強(qiáng),對(duì)中文支持好。
EmEditor Pro 6.00 tracky 漢化版
http://www.hanzify.org/index.php?Go=Show::List&ID=9751
UltraEdit 11.20a 莫名漢化版 UltraEdit勝在處理速度快,大文本幾乎就是瞬時(shí)完成。
http://www.hanzify.org/index.php?Go=Show::List&ID=9183

二、試煉。將系統(tǒng)自帶的輸入法詞庫(kù)轉(zhuǎn)換成極點(diǎn)或酷極格式的詞庫(kù)。
1、反編譯系統(tǒng)輸入法的碼表文件為文本格式。
點(diǎn)擊 開(kāi)始——搜索——文件或文件夾,在C盤(pán)查找imegen.exe文件。 查找到后,雙擊運(yùn)行它。 選擇它的第二個(gè)標(biāo)簽:逆轉(zhuǎn)換, 然后點(diǎn)“打開(kāi)文件”,在彈出的窗口,選擇你要轉(zhuǎn)換的輸入法碼表文件,這里我以系統(tǒng)自帶的鄭碼為例說(shuō)明。界面如下:

  假如你看不到*.mb文件,請(qǐng)?jiān)趶楅_(kāi)的窗口中選擇c:\windows\system32目錄就能看到了。這樣轉(zhuǎn)換結(jié)束后,將會(huì)在c:\windows\system32目錄下生成一個(gè)winzm.txt的文本文件。

2、打開(kāi)winzm.txt文件,你看到的,將是如下圖所示的格式:


  可以看到,它的編碼有詞也有字,格式為: 字(或詞組)+英文字母。另外,還有一些單字+英文字母后還有空格+字母, 這是輸入法為造詞而用的造詞碼,對(duì)我們沒(méi)有什么用處,大家先不要管它。 后面我們將會(huì)教大家如何快速的去掉它。
  請(qǐng)大家將文件開(kāi)始直至[Text]的部分全部刪除,這些是輸入法的規(guī)則定義部分,我們用不上。

3、開(kāi)始處理和轉(zhuǎn)換文本的格式。
前面說(shuō)了, 我們現(xiàn)在得到的文本是:  字(或)詞+ 英文編碼  這樣的格式,而我們打開(kāi)極點(diǎn)的碼表 freewb.mb ,會(huì)發(fā)現(xiàn)它的格式為: 英文編碼+空格+字(或詞)  如果有重碼的話(huà), 還會(huì)在字(或詞)的后面再加“空格+字(或詞)”。
①、我們先將部分單字后面的造詞碼去掉?!∮肬ltraedit打開(kāi)winzm.txt文件,按Ctrl+R,調(diào)出UE的替換窗口,在“查找什么處”輸入“ [a-z]*$”,注意,[a-z]前面是一個(gè)空格,不能少了,在替換為處留空不填。 選中“正則表達(dá)式”,點(diǎn)“全部替換”。 看看,是不是一下子將這些多余的造詞碼去掉了?


  現(xiàn)在,我們要涉及重點(diǎn)了,就是怎樣把現(xiàn)有的這種字或詞+編碼的格式給換成編碼+字詞的格式?

在我看來(lái),無(wú)非是將這兩者調(diào)個(gè)個(gè)兒。現(xiàn)在,需要請(qǐng)到我們的主要工具:Emeditor。EM對(duì)中文的處理很好,這也是我們用它的主要原因。

②、將漢字和編碼調(diào)個(gè)個(gè)兒。
用Emeditor打開(kāi)winzm.txt。 按Ctrl+H調(diào)出查找替換窗口。
在查找處輸入:^([^\x00-\xff]+)([a-z]{1,4}) 然后在替換為處輸入:\2 \1注意,中間有一個(gè)空格,一定別忘了選中“正則表達(dá)式”選項(xiàng)。選中“正則表達(dá)式”,按全部替換,就可大功告成了。Em處理上萬(wàn)條文本稍有點(diǎn)慢,請(qǐng)大家稍等會(huì)就行了。

4、如

何分離字和詞的碼表?
  我們同樣可以用EM來(lái)完成。 同樣以未替換前的碼表格式來(lái)說(shuō)明。
①、 去掉全部的單字編碼行,只保留詞組及編碼。
EM打開(kāi)碼表,按Ctrl+H調(diào)出替換窗口,在查找處輸入:^[^\x00-\xff][a-z]{1,4}$\n  然后在替換為處留空。 好了,看看是不是將單字和編碼全部刪了?記著,一定別忘了選中“正則表達(dá)式”選項(xiàng)。

②、 去掉全部的詞組編碼行,只保留單字及編碼。
同樣的按Ctrl+H調(diào)出替換窗口,在查找處輸入:^[^\x00-\xff]{2,20}[a-z]{1,4}$\n  然后在替換為處留空。 看,詞組和編碼全部已經(jīng)刪除了。同樣,別忘了選中“正則表達(dá)式”選項(xiàng)。

  其實(shí)真正來(lái)說(shuō),處理這些文本,我們都只是利用了它們的正則表達(dá)式功能,正則表達(dá)式在處理文本時(shí)功能非常強(qiáng)大,能完成一些我們幾乎只有編程才能完成的任務(wù)?!∪绻信d趣的話(huà),可以自己找找正則表達(dá)式方面的相關(guān)內(nèi)容研究研究。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
關(guān)于Windows下的輸入法和輸入法生成器?
極品五筆大詞庫(kù)碼表生成器
自制輸入法
極點(diǎn)五筆-一個(gè)和智能五筆用著一樣方便并且完全免費(fèi)的輸入法
帶你認(rèn)識(shí)極點(diǎn)五筆的各種“特異功能”
自創(chuàng)搜狗拼音的超級(jí)細(xì)胞詞庫(kù)
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服