2008/12/31

Wen Quan Yi——文泉驛

在電腦世界中,東亞文字的輸入和顯示一直是個很大的問題。因為漢字的特殊結構及編碼問題,我們有數十種的中文輸入方式 (雖然可以粗分為從音或從形兩大陣營),如正體中文世界中的注音、倉頡、行列、自然等輸入法,以及簡體中文中的拼音、五筆等等。而中文字在電腦上的顯示和排版一直是個令人頭痛的問題。在以前,一些不常見的字根本不可能在一般電腦上顯示得出,如下圖中的幾個字:


罕見字

就算是現在,仍然沒有一個中文字體可以顯示所有的中文字,也沒有一個中文輸入法可以輸入所有的中文。

免費和開放的中文字體有:
王漢宗自由字型教育部字體教育部全字庫字體螢火飛(firefly)字體、還有新近頗有長江後浪之勢的文泉驛字體。若是考量字體美觀度和應用,則王漢宗和教育部字體不錯;但若是考量能顯示正體和簡體,甚至是其他東亞文字,則 firefly 和文泉驛(文泉驛正黑體)是不錯的選擇。

在這裡,我想要說的是最近文泉驛在開發「微黑米」字體。只要是 有閒有能者,都能參與字體的開發。它有點類似 wiki 系統,只要按照它網頁上的簡易教學編輯點陣或向量字並上傳到開發資料庫,那麼,你所編輯的字體就很有可能會在最終入選到「微黑米」字體庫中。怎樣?會不會有種創造的衝動?那就加入文泉驛「造字」的行列,為免費中文字體貢獻自己的一份心力吧,反正以後你也會用得到。在開始之前,請先看一看簡介使用教學,很簡單的。

嗯,唯一可能會讓大家不習慣的地方是整個網站都是簡體版,不常接觸簡體字的人可能會很不習慣。我自已是從高中就接觸簡體字,所以沒有什麼問題。雖然簡體字很醜、缺了點正體字的唯美,而且會讓人聯想到日本文字 (個人觀感啦),不過,要學起來還真不是什麼大問題。剛開始只要按前後句猜字的意思,並按想像猜測,約一周之後就幾乎感覺不到滯礙之處了。



Powered by ScribeFire.

Powered by ScribeFire.



2008/12/22

張大春之認得幾個字《剩》

張大春在中時電子報上的文章,如果是平面媒體的話,文章應該是會被放在中時副刊上的吧。不曉得這聯結多久後會失效,有空的人早早看完吧。

讀完他老人家的這一篇之後我才發覺《剩》字似乎真的有兩種意思。一種是「多餘」的,另一種則是「僅有」的,下面是節錄該文的第一段:

一定有甚麼哲學上的解釋能夠說明:中國老古人把「多餘的」和「僅有的」兩個全然不同甚至有些相對的意義概念卻用了同一個字來表達。

上面的文字是 copy&paste 來的,所以錯字不是我寫上的,相信也不會是張大春故意寫錯。作家畢竟不同於寫手,他們對文字會有一種特殊的要求。

所以回歸正題,在使用「剩」字時,究竟我們會不會從此就特別注意它在文句中的涵義?我想我自已最近會有這種現象,但久了之後還是回到原來使用它的習慣。語言雖然有規範,但總還是約定俗成地多,有些像是遺傳學中的變異特性。

寫這篇只是分享張大春的這篇文章。另外,記得國中時候在從圖書館中借來某書中的一篇文章裡頭看到有人特別將中文中的含有「打」一字的詞給列舉出來,那時候才發現「打」的用法/用處還真是多呢,它或許是除了「的」之外最隨處可見的字之一吧:架、鬧、理、車/的來、電話、水(別用竹籃啊)、從那時候、掃、臘、秋風、吃飯睡覺東東、算、算盤、氣、電腦(電腦不會壞,XD)……有些可能有意義上的重覆,我就不管了,反正就是舉個例罷了。



Powered by ScribeFire.

2008/12/17

第二篇本土出品的 Cell 論文:嘗試揭開物種種化的神秘面紗

今天聽到實驗室的榮俊說中研院分生所助理研究員呂俊毅博士在 Cell 發表了一篇論文。

如果沒記錯的話,這應該是台灣第三篇純本土獨立研究後曾發表在 Cell 的論文了。第一篇中興大學某團隊因為其論文內容有作假,所以後來被退回;第二篇是清華大學江安世教授定位果蠅單一神經元的研究。而呂俊毅實驗室的這篇論文,則應該就是近期最有看頭的了。難得的是這篇論文是呂俊毅回國後兩年中做出來並發表的。這在中研院首頁也有相關消息。論文標題是:

Incompatibility of Nuclear and Mitochondrial Genomes Causes Hybrid Sterility between Two Yeast Species

Cell, 2008, 135(6): 1065-73.

順便給一張呂俊毅老師在分生所網頁上的圖:



論文內容我還沒看,不過,中研院首頁的公關簡介中提到了一個概念 (不是呂氏團隊首發,而是由 Dobzhansky & Muller 兩位在 1980 年代所提出的假說),就是不同物種之間所產生的後代 (指 F1) 之所以不孕可能是因為有一組「鑰匙和鎖」之間的特定基因產物無法配對。呂氏團隊所找到的看樣子也剛好是兩個分別位在酵母菌細胞核 (AEP2) 與粒線體 (OLI1) 中的基因。AEP2 和 OLI1 必需是來自於同一個物種才能使得子代具有遺傳能力,好玩的事是 AEP2 會調控 OLI1 的轉譯。我還沒看到原文,所以不清楚是倒底轉錄還是轉譯,不過不管怎麼說,AEP2 應該是進入粒線體中作用。目前不清楚其他物種的「鑰匙和鎖」是否也具有分別位在不同「遺傳物質庫」的特性,即分別位在「細胞核與粒線體」。

看到這兒,大家或許都會開始想像,如果在某不孕的 F1 子代中表現鑰匙或是鎖的基因,是否就會打破種和種之間不孕的藩籬?這樣一來,很多以前只在小說中才會出現的禁忌事物可能也會馬上跟著出現。這應該是繼複製動物議題後最具爭議的話題了吧。

當然,按照慣例,在酵母菌中看起來是這麼簡單的關係到了高等生物如老鼠或人類身上可能就比較複雜些,會多了很多調控的關卡。所以暫時應該還看不到獅虎或虎獅會生下獅虎或虎獅。

Powered by ScribeFire.

2008/12/09

火警又來了

新聞一新聞二都是隨手從網路上選的報導。大抵是講述十二月六日在院方行政大樓因施工意外所造成的消防事故,並造成一名工人和一名研究員 (PI) 受傷。




而當天晚上九點,生醫所也傳出意外走火事件,消車來了,一堆住在附近的生醫所 PI 也來了,所幸這只是虛驚一場,只是有台零下八十度的冷凍冰箱跳電導致電線走火。人員也「被陸陸續續地疏散」,事實上應該說是一群沒有消防意識的傢伙們三三兩兩地步出生醫所。

新聞上說這是四年來第四起「有記錄在案」的火警,呵呵,這是一種文字遊戲,可能是定義或認知的不同。不曉得這是指在同一個行政區消防隊所接到的案件,還是「被白紙黑字記錄下來」的事件。事實上,這兩個月內就有四起消防事件,其中十月和十一月都是在分生所,而十二月六日的兩起,一個是在行政大樓,一個是在生醫所。這四起事件,消防隊都出動了大量的人力、物力——雖然其中兩起似乎算得上是烏龍消防事件,實在不需要出動消防隊員。所以,實際上這四年豈止四起火警意外。

再附上一張以前 (2006年) 所拍攝的。和十二月六日的火警規模不相上下:



其他相關照片在:http://picasaweb.google.com/lawaylab/RNALab#

Powered by ScribeFire.

2008/12/05

Specifec Activity of radioactive transcripts

一直以來,計算 in vitro transcribed 出的 RNA 或經由 DNA polymerase 做出的、isotope-labeled DNA 的 specific activity 是我的痛。我一直沒搞清楚為什麼可以由已知 isotope input specific activity (micro-Ci/nmole)、DNA template (nanogram)、和用幾張 filter paper 上點的 isotope 的量 (cpm),計算得到 polymerase 所做出產物的 specific activity (dpm/microgram)。

今天 Lab Meeting 上被電之後,我到圖書館散心找資料,結果意外發現了一個好物,一條計算 specific activity 的公式:



Specific Activity 公式


出自 The condensed protocols from Molecular Cloning (Joseph Sambrook & David W. Russell, Cold Spring Harbor Laboratory Press, 2006) 一書。又是公式,沒錯。在我不應該沒有研究生樣地不想搞清楚 transcript 的 specific activity 到底怎麼得出來的時候,它還挺好用地。
Specific Activity 的單位是 (dpm/μg)。
公式中的其他項目是:
L:input radioactiv label (μCi)
PI:Washed/Unwashed value from DE81 filter paper
m:mass of template DNA (ng)
S:specific activity of input label (μCi/nmole)

而 DE81 filter paper (Whatman) 是要在 0.5M disodium hydrogen phosphate (pH 7.0) 中清洗。而我們 Lab 的 protocol 則是在 0.2M ammonium bicarbonate 中清洗。下次換成前者來洗好了,因為實驗室已經很少在用 DE81 法來計算 specific activity 了,而 protocol 則不曉得是誰抄自何處?

Powered by ScribeFire.

2008/12/01

RNA-binding proteins and their interacting sequences

唔,這篇是用來記下一些腦子經常會忘掉但又常用的東西。

有越來越多的証據顯示 RNA-binding proteins 大多有其專一性結合的 RNA 序列,即便是 ESE finder 網站上的 SR proteins,也都有各自的 RNA 結合序列。以下的表格只是稍微統整一下手上的資料。以後若有更新的資料,我會再追加。



RNABP 和 RNA seq


RNA 序列是以 IUPAC 的符號來表示:
[A/G: R]、[A/T: W]、[A/C: M]、[T/C: Y]、[T/G: K]、[C/G: S]

在參考資料中,SR proteins 和 Nova 的 RNA 結合序列是由 SELEX 的方式得到。

參考資料:
Nature Reivew in Genetics, Vol 3: 285 (2002)
Nature Genetics, doi: 10.1038/ng.264 (2008)


Powered by ScribeFire.