2007年2月28日 星期三

伊呂波歌

《伊呂波歌》一詩除了「ん」(n)外,現行的日文平假名的每一個字,都在這首詩中出現了一次(「ゐ」(i)與「ゑ」(e)於現代日語中不再使用):
色は匂えど (いろはにほへと)
散りぬるを (ちりぬるを)
我が世誰ぞ (わかよたれそ)
常ならむ (つねならむ)
有為の奥山 (うゐのおくやま)
今日越えて (けふこえて)
浅き夢見し (あさきゆめみし)
酔ひもせず (ゑひもせす)
詩歌便是因為首行的頭三個字「いろは」(いろ是顏色及佛教中「色」的意思)而得名。
在我們今日熟知的「五十音順」出現前,日文假名的排列,其實是依循著上述的「伊呂波順」排列。也就是說,曾經在很長一段的歷史長河裡,只要學會了《伊呂波歌》,就學會了日文的假名。
《伊呂波歌》的意涵,是這樣的:
花開溢香,然而不日也會凋謝;
我世之人生又豈有終此不變?
如今將超越此生,渡無常之深山,
速從淺夢中醒來,莫沉迷

而這詩句,據稱是《涅槃經》中此偈
諸行無常
是生滅法
生滅滅已
寂滅為樂

2007年2月8日 星期四

翻譯名詞的幾個想法

如何加速外來詞彙的中譯
  1. 利用網路--大家一起來,維基百科
  2. 利用網路為語料庫的想法--自動翻譯(http://translate.google.com/translate_t)
  3. 自動搜集--自動傳送委員票選

2007年2月4日 星期日

出版資源

老貓學出版部落格 (已關站)圖書出版業、編輯知識、產業分析....
老貓學出版專欄
出版偵查課

2007年1月29日 星期一

心經

觀自在菩薩。行深般若波羅蜜多時。照見五蘊皆空。度一切苦厄。
舍利子。色不異空。空不異色。色即是空。空即是色。受想行識。亦復如是。
舍利子。是諸法空相。不生不滅。不垢不淨。不增不減。是故空中無色。無受想行識。無眼耳鼻舌身意。無色身香味觸法。無眼界。乃至無意識界。無無明。亦無無明盡。乃至無老死。亦無老死盡。無苦集滅道。無智亦無得。以無所得故。菩提薩埵。
依般若波羅蜜多故。心無罣礙。無罣礙故。無有恐怖。遠離顛倒夢想。究竟涅槃。三世諸佛。依般若波羅蜜多故。得阿耨多羅三藐三菩提。
故知般若波羅蜜多。是大神咒。是大明咒。是無上咒。是無等等咒。能除一切苦。真實不虛。
故說般若波羅蜜多咒。即說咒曰。揭諦揭諦。波羅揭諦。波羅僧揭諦。菩提薩婆訶。

2007年1月26日 星期五

IUPAC命名規則

IUPAC命名規則(Nomenclature)-英
http://www.chem.qmul.ac.uk/iupac/

SMILES

SMILES(Simplified Molecular Input Line Entry Specification),簡化分子線性輸入規範,是一種用ASCII字元串明確描述分子結構的規範。

SMILES由Arthur Weininger和David Weininger於20世紀80年代晚期開發,並由其他人,尤其是日光化學信息系統有限公司(Daylight Chemical Information Systems Inc.),修改和擴展。

由於SMILES用一串字元來描述一個三維化學結構,它必然要將化學結構轉化成一個生成樹,此系統採用縱向優先遍歷樹演算法。轉化時,先要去掉氫,還要把環打開。表示時,被拆掉的鍵端的原子要用數字標記,支鏈寫在小括號里。 SMILES字元串可以被大多數分子編輯軟體導入並轉換成二維圖形或分子的三維模型。轉換成二維圖形可以使用Helson的「結構圖生成演算法」(Structure Diagram Generation algorithms)。

其他著名的線性記法包括Wiswesser Line Notation (WLN),ROSDAL和SLN。最近國際純粹與應用化學聯合會推薦國際化合物標識(InChI)作為標準的分子式表達式。

然而普遍認為,SMILES與InChI相比更具有可讀性;而且很多軟體都支持SMILES,其中不少軟體都具有圖論等方面的理論基礎。

SMARTS是SMILES基礎之上的改進版。
摘自維基百科(http://zh.wikipedia.org/w/index.php?variant=zh-tw)

2007年1月25日 星期四

Unicode vs ISO 10646

Unicode 的編碼方式與 ISO 10646 的通用字符集(Universal Character Set,UCS)概念相對應,目前實際應用的 Unicode 版本對應於 UCS-2,使用16位的編碼空間。

通用字符集(Universal Character Set,UCS)是由ISO制定的ISO 10646(或稱ISO/IEC 10646)標準所定義的字元編碼方式,採用4位元組編碼。

ISO 10646或Unicode都只是編碼標準,並不處理字形風格標準之問題。字形的風格可以透過改變顯示字體來解決。
參見維基百科(http://zh.wikipedia.org/w/index.php?variant=zh-tw)內相關條目

Unicode各版本字數

  1. unicode 1.0版提供了20,916個漢字(包括正體中文、簡體中文、日語及韓語所用的漢字)。
  2. unicode 3.0版引進的「擴展A區用字」
  3. unicode 3.1版的「擴展B區用字」
  4. unicode 4.1版的「GB 18030 與 HKSCS 增補用字」。一般電腦若不特別去裝上字體,無法看到這些字。
Windows XP & Windows Server 2003預設是 Unicode 2.0,待安裝新細明體更新套件 1.0 版(內有 Extension A 與 Extension B Surrogate package,微軟網站下載點己移除 )之後,有下列的組合:
Unicode 2.0 & Ext-A --> Unicode 3.0
Unicode 3.0 & Ext-B --> Unicode 3.1
(資料來源:microsoft.public.tw.windows)