本帖最后由 ldlcau 于 2011-4-20 09:34 編輯 . B$ S7 l* a" _- _ & d! d, t2 _ e+ `- J# q9 @* Q8 t+ G mdict是顯示mdx內容的工具,mdxbuilder是編譯mdx源文件到mdx的工具,mdd是mdx的附加資源庫文件,mdd不能單獨執行。3 C7 e/ t0 w6 ?( n6 L y7 V 2 G; R$ V* F; l0 F& Y 制作流程: 圖文資料--整理成mdx源文件--用mdxbuilder編譯轉換為mdx (mdd同時生成)--使用mdict瀏覽mdx(mdd)的內容。+ ^1 D; N2 k& c, s 1、mdict制作常用文本格式(mdx源文件) mdx源文件常見格式詳見附件中的示例 ![]() 4 v4 c7 ~8 {$ f" V/ ~! P 轉換軟件MdxBuilder,下載地址http:///forum/thread-3747-1-1.html2 O" K' G2 ?0 b: A$ ~/ B% G9 M9 T 首先制作MdxBuilder轉換所需的原始格式txt文本文件 最常用的是MDict的html格式 每個項目兩行 o! w- p( N7 c# r 第一行是關鍵字 第二行開始是正文, 這里的正文應該包括關鍵字。可以使用html的標記(不要包含<html>- K n5 q0 O6 g D" m <body></body></html>, 這個程序會自動加上, 另注意在轉換時要指明源數據為html). & e4 T9 L& A6 x5 L 如果需要顯示音標的話,可以利用html指定字體就可以顯示了。(參見下面的例子) 正文結束后必須用一行</>表示結束 例子: 1.txt5 ~+ A! x; A. w! A+ t 詞條1標題Whole 詞條1內容<font size=5>whole</font><br><font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font> </>: M8 E& J% H- i 詞條2標題 詞條2內容 </> 詞條3標題3 z8 y, N' Y7 i* B 詞條3內容# t9 |' b0 O9 Y" [" m- _2 H; _ </>$ I' e: b. J" V* S" b) N$ P / u/ S" B& d6 ?0 F' N& D% L8 K ? (注意"</>"和下一個記錄間不要有任何其他空行,請參考example.txt中的例子)$ M" Q5 E! k3 K0 O5 A- q0 W' e, E 在html中連接到其它關鍵字的方法:# A# E. ^, v9 i9 g$ { <a href="entry://key">key</a> 其中key是關鍵字,1 i i3 A; P! ^7 z+ K6 [ 詞條內部跳轉方法 <a href="entry://#1">目錄一</a> (一定要有<a name=1></a>相對應) 在html中嵌入圖片的方法:(' H% _) k9 ^/ m) S <img src=file:///abc.gif> 其中src指向的文件名大小寫不敏感9 y4 e5 K' L9 |+ G 并將所有圖片文件放在一個單獨的目錄中(不要與詞典源文件放在同一目錄中). 數據目錄中可以 帶有子目錄。在使用MdxBuilder制作詞庫時,將Data路徑指向上面存放數據的目錄,該目錄中的 所有文件都會被壓縮到后綴名為.mdd文件中,使用時該.mdd文件應當與.mdx文件在同一目錄下。& ^1 ^2 [3 Y6 ^3 f MDict 3.1 支持多個mdd文件組合成一個mdd來使用 ( x0 Q' D! t$ G# Z0 R5 N4 [ 制作方法:將圖片分成幾個目錄,然后逐個目錄打包就是了。 打包后的文件名: 詞典.1.mdd 詞典.2.mdd 詞典.3.mdd ......$ i) ^1 }7 Q, }* J 調用方法不變。 程序在第一個里找不到,就去第二個里找。。。 ![]() 加入外部樣式表的方法 制作時在每個詞條內容前加上% H4 `- u# P, I2 c7 j3 [ <link rel="stylesheet" href="style.css"> 這句話,然后生成mdx 生成的mdx與style.css放在同一目錄下。 style.css內容示例:
2、數據處理方法(生成mdxbuilder可以編譯的文件,就是上面介紹的) ; [! _- {: h( f/ B c 一、mdict編輯器網絡版 處理好txt文本或者htm文件后,可以利用mdict編輯器 導入數據庫后編輯然后再導出為mdx源文件,綠色文件解壓后可直接運行。 http:///forum/viewthread.php?tid=4498 " f& x% I3 E8 @ o: P/ ~! g0 ] 支持無限多文本。 并且支持可視化在線編輯 和在線提取、批量下載網頁文件。推薦新手使用。' X+ J: J0 w; @! n. [& ~& H ' D2 I; e( f( [' D' i& T 二、MDICT文本處理軟件 簡單的編輯工具 a. MDict詞庫可視化編輯器 (Mdx Source File Maker) V0.3 http://bbs./viewthread.php?tid=609517感謝 nbdx-mmrs 網友制作此軟件; y; P2 n5 P4 n6 g, j 2 y4 y9 l5 ]6 _2 C; | b.批量文本處理程序,注意事項:每個txt文本文件的名稱作為詞條標題,類別處請留空(刪除“AA”),下載見附件,這個缺點是有時會有亂碼。 c.簡易詞典制作工具: http:///forum/thread-4513-1-1.html (感謝fdfdrere) d、html2mdx ! }* t3 r& B" b/ p1 O( b5 H0 _ 將html文件轉換為MDict格式文件的程序!Wncable(Bowang)大俠的工具軟件,可以將Html格式一次性轉換成符合Mdx格式要求的Txt文件,隨后便可以用MdxBuilder軟件直接生成Mdx文件了! http:///forum/viewthread.php?tid=840 G* P+ ~- z4 o( n5 l ! {7 @" H4 o' `2 Y 三、其他方法:1 W9 V5 K. R) w9 E1 ?+ W* ?8 ] a.逐條輸入→MdxBuilder支持txt→MdxBuilder生成(適用于制作自己平時日積月累的東西,可以生成漂亮的表格)- D! G2 e5 z$ _, `: t. } b.利用MdxBuilder支持的格式的詞庫轉(適用于轉現成的SugarDict,KDict詞典) c.其他→(excel)→文字編輯軟件(用UltraEdit-32好于EmEditor好于word)→MdxBuilder支持的txt文檔格式→MdxBuilder生成(適用于高效制作一切能方便轉為excel文檔的詞典)# j N& }2 f) L0 U0 a. T' G( ^ http://bbs./viewthread.php?tid=179661 d. 我的mdict詞庫制作體會 (蓮花無語 提供) http:///forum/thread-4088-1-2.html # h) s) o1 N0 o+ G$ F$ r 四、危機百科 原始數據:http://download./zhwiki/# q7 }4 Q. o0 W! C' l" r! b ; T/ r$ E8 Y0 j" [7 o8 b 危機百科轉mdx源文件制作工具 * d0 K% o4 V. I; A7 a* X5 B n w http:///forum/thread-1315-1-1.html http:///forum/viewthread.php?tid=86 - F% b( n& {. a 危機轉換工具 Wiki。ToMDict2.0 http:///forum/viewthread.php?tid=869 P, B; @; z8 u h2 L: m : \' [! B/ P. w4 w0 ` Wi。ki2Txt V1.1 下載地址 http://bbs./viewthread.php?tid=500730 V2.16 r, L5 b* }+ Q2 ] http://bbs./viewthread.php?tid=753395! f G* O; y" z! r 6 w% Z8 ~3 A k% [, Z5 g 五、Txt文件詞條合并工具 Combine,綠色版4 e8 H" {( {5 y9 x Wncable(Bowang)大俠的巨作,可將多個詞典的相同詞條合并成1個! http:///forum/thread-87-1-17.html * x4 c. q& i, _1 U! i; n 六、mdxexport ,將Mdx文件轉換為Txt文件 http:///forum/viewthread.php?tid=954: S0 ~! W* d: |& ]' A -------------- 3、mdxbuilder轉換信息 以上方法處理后得到的文件再用mdxbuilder轉換; ]' v+ L9 r1 } 6 F: t" B. M0 O8 x# b% q MdxBuilder關于選項的說明:/ }, n3 A9 W+ m1 r6 q$ P, J3 p/ k a) Key case sensitive 關鍵字(標題)是否大小寫敏感。多數情況下詞典是大小寫不敏感的,所以不要選。* g7 a) g% R' O0 _& Q4 e b) Allow export to text! c+ H4 v" y& Q+ q 是否允許導出為文本。如果選了,就可以用MdxExport這個工具吧詞典導出為文本格式。 c) Right to left text 文字的閱讀順序。中文是從左到右,阿拉伯文之類的是從右到左。0 k$ W' z( v* Z0 x2 O( D5 g" ^3 b d) Strip key 是否去掉關鍵字中的特殊符號。例如21世紀詞典里的關鍵字是顯示成"lis.ten" 這個樣子的,如果不去掉".",則用戶需要輸入"lis.ten"而不是”listen"來查詢單詞。 e) Title% L* a$ e7 P. d) Z, k 這個是用來標示詞典的名字,計劃將來在需要顯示詞典名稱的地方進行顯示用的。但目前暫時沒有用處。 f) Description 詞典的詳細介紹。第一次打開詞典時看到的歡迎頁面。 g) Build Data archive6 y5 K% D+ B" b' V- w 僅進行數據文件制作。主要是用來制作圖庫,聲音庫時用。勾選后就不用填寫Source路徑。 h) Index block size, Record block size. 這兩個是調整性能用的,用缺省值就好了。6 d7 q7 e! {7 O8 A! Z i) Encryption Key 詞典加密的密匙,用于詞典授權用的。可以參見MdxBuilder.zip里的LibKeygen.txt的說明 注意事項:, U2 m+ z5 p5 X5 _ W4 u5 U' D1 A 1、圖片鏈接最好使用 <img src=file:///1/1.jpg> 這樣的格式; F; k' L% Z4 I- v/ `; W 2、轉換出錯一般是標題位置有多余的空行 如:( l+ j$ H5 `' ~( q 詞條1標題! l5 b; j r8 k6 } 詞條1內容6 Y& `8 u' L' f( C1 @. Y1 y8 u2 c </># v- Y- l2 W- _8 ?4 v, S 詞條2內容- b/ r$ Z: q; ?/ { </>2 {2 [, w" q% y# G 3、mdxbuilder處理轉換后的mdx文檔大小應在4G以下 MdxBuilder出錯信息 1、出錯信息:“Keyword is longer than 255 at position: XXX of the source file”* I0 V2 }, b& B 可能原因:標題位置缺少換行,使用編輯工具編輯并存檔后,txt并未能識別你所制作的文件己隔行。 用UltraEdit打開文件按Ctrl-H進入16進制模式,然后按Ctrl-G, 再輸入 XXX (就是報告錯誤的位置). 然后再按Ctrl-H返回文本編輯方式。。。 解決方法:再新建一個檔案,然后將所有的文字復制到新的檔案中;指定行處增加換行。 2、出錯信息:加載正常,但轉換中內存溢出。. G4 ?) v# l/ J7 q2 ~& p1 I 可能原因:源文件過大 解決方法:使用mdxbuilder大文件特別版 3、出錯信息:Invalid keyword at position: XXX of the source file。 Failed to load source file, process cancelled6 k' Y! v6 z# E0 l, ] 可能原因:標題位置出現不必要的空行。0 t5 q& n- \( v. P; n) y8 i 解決方法:用UltraEdit打開文件,Ctrl-G, 再輸入 XXX (就是報告錯誤的位置). 刪除空行,空行較多可用正則表達式批量處理。9 Z! \) P; v F1 P1 m0 ^! A ------------------ 4、mdict版制作常用編輯工具軟件(用來編輯mdx源文件 或 收集處理文本資料)1 }, V3 {. W) R# p" B UltraEdit-32 編輯工具2 A* ~5 l( f/ K1 j6 u% w' I2 f7 \ UEDIT查找替換高級教程(制作電子書與MDIT辭典必看) G! ]. F; h% f- e; G& N& Z 其實UEDIT32的搜索替換至少有兩個最明顯的優點:4 i8 ~0 B. P1 \& E* v; c6 w 一、執行速度非常快,是WORD的數千倍,不信你打開一個20M的TXT文檔,用UEDIT替換只要3秒鐘,用WORD看要不要幾個鐘頭? 二、UEDIT的替換內容可以包括查找到的內容,這是在WORD以及更高級更專業的“微軟正則表達式”所都無法支持的,不過這個應用可能大部分的朋友都不知道。6 x7 n! ^0 g: g" ^2 [ I' A 雖然許多極其復雜的文檔查找與替換必須使用較專業的正則表達式來處理,但對于一般甚至比較高級的操作來說,UEDIT還是我們的不二選擇。現在我來簡要介紹一下UEDIT的查找與替換的高級應用。: z# [3 m1 |/ D; z7 u4 r; E 以下的示例使用中文版UEDIT10進行講解$ @0 Y* F. o5 a0 Q( b 1. UEDIT查找的快捷鍵是Ctrl+F(find)或ALT-F3,替換的快捷鍵是Ctrl+R(replace),再次查找的快捷鍵是F3。 2. 一般查找與替換功能:8 e4 q. Y. [1 A& S+ O- P ※在查找/替換框內將“正規表達式”的√給去除,并分別在查找與替換的框格內輸入所需的字符,執行查找與替換即可。 ※如果需要匹配回車鍵,在查找框中可輸入^p(注意p是小寫)來代替回車鍵) C' ^) C# \4 d2 J3 l( K ~& W& C 說明:在unix格式中^n表示換行,而在mac的文本格式中^r 表示換行,dos格式中^p 表示換行,不過一般情況下^p 可以同時兼容^r 或^p 舉例: 將$ Y5 ]- n) U7 [) F dfdf$ _+ ^0 k4 H) v8 L y ss0 ?3 m ?) P0 i- P1 x fssdf給替換為dfdf,ss,fssdf格式:可在查找中輸入^p,替換中輸入,(半角逗號)即可。2 {3 @5 v, a) y 反之將dfdf,ss,fssdf給替換成以上三行只要在查找中輸入,(半角逗號),替換中輸入^p即可。1 A9 O2 s' C/ [$ Z6 k' F* d, V 高級查找部分: 1.要記住將查找/替換框中的正規表達式給√上, [: x: w3 G5 d1 E' g! D 2.常用的查找/替換命令: % 匹配行頭(0字符,僅是匹配一個位置)6 L: v4 r2 C6 A9 q; A $ 匹配行尾(0字符,僅是匹配一個位置) 在一行中匹配一個單字符4 T7 y$ M% m3 w2 t+ a T * 匹配一個或多個字符(不允許跨行匹配)" p7 v! W' L% F + 匹配+左邊的那個字符一或多次(不允許跨行匹配). ++ 匹配+左邊的那個字符零或多次(不允許跨行匹配).# g- T8 [ ]3 h: z4 {0 ? ^b 匹配分頁 ^p 匹配DOS文本的換行符(通用) ^r 匹配MAC文本的換行符7 N0 R& r {6 I" d# ]- E ^n 匹配UNIX格式文本的換行符(在wondows操作系統中一般情況下可與^p互換) ^t 匹配tab符 [ ] 匹配單字符或字符范圍5 J% k* s. P0 D1 H0 [) t ^{A^}^{B^} 匹配A或匹配B ^(...^) 用于替換框中代替查找的內容 http://bbs./viewthread.php?tid=565520&extra=page%3D1%26area%3D# R5 c* X( G# Y4 r; H$ t( o" `" v ) ?0 q# h' x0 I( w3 F- N6 } EditPlus v3.21 漢化版 J. m* b5 m7 c. h 適合少量文本文件批處理,支持不超過50M左右的單個文件,擁有強大的正則表達式處理功能。 http://www./soft/690.htm 菲菲更名寶貝, v) Z- D. m2 ]+ J# c 支持文件批量、改名以網頁標題更名、以文本文件的第一行更名,各種內碼轉換等等; http://www./soft/59019.htm http://www./Soft/ShowSoftDown.asp?UrlID=2&SoftID=74 i' x! C' W+ w ( W9 h+ P- B# y0 M, P/ t 多行文本替換工具# { F! L! l& y# K http://www./files/a089fd7a-973f-11dd-96d5-0019d11a795f/& Z& D' ]; ~) A$ \' z5 w TextForever 6 D* h" V6 ~# M6 x, c- \: _ TextForever(FineReader) 版本:1.75 評價:★★★★ ) _: N( C2 \: m: d) C7 a C9 W 文件: 中文簡體版 中文簡體版說明 English版(其中說明文件還是中文的) 中文繁體版 v1.58(感謝阿呆2的辛勤工作!) " j" c+ O& v! [' I# A& ^ 功能: 提供以下功能:HTML->TXT轉換、文件合并、TXT文件段落合并、TXT文件分行、編碼(GB/GBK/Big5/Shift-JIS/Unicode)轉換(只能用于Win 2k/XP)、文本替換、HTML代碼整理、文件切分、文本提取、正則表達式、TCR批量壓縮/解壓,用于整理從Internet上下載的小說。軟件原名FineReader,后更名為TextForever。 動機: 我初上網時常去“阿拉談書屋”看小說,網主無聊到將每一頁做成一個文件(后來他也為此而后悔不已),看起來很累,所以就想編一個程序能對下載下來的文件進行合并、整理,變成TXT文件以便閱讀、打印。1 Y! `+ z- h E9 b* l 為了編制這個程序,我專門從Internet下載了一堆HTML文檔,苦讀半月。所以有一次我和一個朋友開玩笑:他通過做主頁練HTML,我則通過讀主頁練,大家殊途同歸。 說起來“阿拉談書屋”對我所起的作用實在不小,不僅將我引進了Internet的大門,還為我學習Internet編程提供了強大的動力,先后產生了CrazyReader和TextForever(FineReader)。 這個程序的段落合并功能則是在我對在網上大肆吹噓的某“智能排版”工具感到極端厭煩的情況下做出來的,保證比它好使。 8 D/ |+ D; \0 w6 K9 ` http://www./stronghorse/software/exe/TextForever_chn.zip. E8 ]) z. S# G4 K- _& U teleport pro 網站網頁抓取軟件0 _% H- ]% q1 g# i Teleport Pro可以從Internet的任何地方抓回你想要的任何文件,它可以在你指定的時間自動登錄到你指定的網站下載你指定的內容,你還可以用它來創建某個網站的完整的鏡象,作為創建你自己的網站的參考。 Name:greendown Code:714841311 http://www./download/view-software-1446.html http://www./tracky/article.asp?id=38 0 K2 j3 X, o6 \/ y9 J* N( r wget綠色版下載工具 是一個從網絡上自動下載文件的自由工具。 wget可以跟蹤HTML頁面上的鏈接依次下載來創建遠程服務器的本地版本,完全重建原始站點的目錄結構。這又常被稱作"遞歸下載"。在遞歸下載的時候,wget遵循Robot Exclusion標準(/robots.txt). wget可以在下載的同時,將鏈接轉換成指向本地文件,以方便離線瀏覽。: D& h8 N# C* a( e! X! m/ D( f 9 H1 p, N7 G6 K9 W5 g) L7 L5 z wget非常穩定,它在帶寬很窄的情況下和不穩定網絡中有很強的適應性.如果是由于網絡的原因下載失敗,wget會不斷的嘗試,直到整個文件下載完畢。如果是服務器打斷下載過程,它會再次聯到服務器上從停止的地方繼續下載。這對從那些限定了鏈接時間的服務器上下載大文件非常有用。& G0 d1 l B2 s9 ^$ J |
|
來自: sevenpoints > 《待分類》