跳到主要內容

發表文章

為什麼外語難學(之一)?

英文學了這麼久,我還是會常常在說話時忘記單複數,性別,時態的詞形變化。像是可能會說成,He do his homework. 這一兩年在很不專業的學德文,發現除了單複數和性別之外,又有要背的東西了... 我們說,中文是沒有屈折變化的語言。在許多語言中,屈折可以表示時態,格位,數,性別。其中包含名詞詞形變化,形容詞詞形變化,動詞詞形變化等。 例如:我買了一顆蘋果。/ 我買了兩顆蘋果。 I bought an apple / I bought two apples 在中文中,複數的蘋果還是蘋果,還是英文中就多了-s 。這屬於名詞的詞形變化。 又例如:這餅乾很甜 / 這餅乾更甜 This cookie is sweet / This cookie is sweeter. 在中文中,甜這個形容詞本身並沒有變化,但在英文中多了比較級 "-er" 又例如: 我喜歡跑步。/ 我跑步了 I like to run / I ran 在中文中,現在式的跑步與過去式的跑步並沒有差異。 但在英文中,run這個動詞有了屈折。 屈折變化/詞形變化分成以下 : 綜合語 Syntgetic Language:一個字裡有多個語素。 孤立語(分析語) Analytic / Isolating::不使用屈折變化,一個字基本只有一個語素。如中文。 綜合語又可以細分為: 1. 多式綜合語 Polysynthetic Language: 一個詞通過多個語素連在一起,形成一個完整句子。 例如楚科奇語: Tымэвӈылэвтпыгтыpкын. (T-ы-мэвӈ-ы-лэвт-пыгт-ы-pкын.) 單數第一人稱.主語-大(嚴重)-頭-痛-第一人稱現在式 「我有嚴重頭痛。」 (Skorik 1961: 102) 2. 黏著語: 其詞素(詞綴)僅表達一種意思或僅具有一種語法功能。 例如土耳其語: Avrupa 歐洲 Avrupa-lı 歐洲人 Avrupa-lı-laş 歐洲化 黏著語中的語素可拆解,且輕易地能分辨兩個語素。 可以解釋為,“串上的珠子” 串指的是詞幹,珠子就是語素。 3. 居折語 :其詞素(詞綴)可表達多個意思 例如西班牙語: [ ' abl-o ] 我在講話  -o 表示...
最近的文章

什麼是計算語言學及計算語言學到底幹嘛了?

計算語言學,又或者自然語言處理,是一門跨學科的研究領域。在這個領域中,研究者試圖找出自然語言的規律,建立運算模型,最終讓電腦能夠像人類般分析,理解和處理自然語言。 在自然語言處理方面,我們最終極的期待是做出像星際大戰(Star Wars)裡C-3PO一般的機器人或者星艦迷航記(Star Trek)裡的宇宙翻譯機。 而最新技術裡的典型例子包括:Google翻譯,Apple的Siri,IBM Waston, Microsoft Cortana, Amazon Alexa 等。 自然語言處理難在於,他所包括的領域眾多。其中,自然語言處理依賴語言學裡處理字,詞,句子的方式 ;心理學裡人類如何理解,使用語言來溝通;計算機科學中的模型和演算法;哲學中的語義和如何解釋知識,和如何將智慧和解釋使用人工智慧的方式描述。 語言分析的層級和計算難度 當電腦在讀取一個句子甚至一個單字時,經常會有一些問題出現。 語素 以語素方面表示,untieable這個字究竟是不可被綁的還是可被鬆綁的? 字典這個東西,不是每個字都有,我的意思是,不是每一種可能出現的變化都有。例如我們在字典裡可以找到,鬆綁(untie)這個字,但是找不到能綁起來的(tieable)。而電腦要能區分哪個部分才是詞綴,從而得知untieable這個字應該是可被鬆綁的。又或者有人說,根據內容,應該是一個不可被解開的結,畢竟不可被綁的結似乎是不合理的。 句法 以句法方面,rice flies 這個字是飯(名詞)蟲(名詞) 還是飯(名詞)在飛(動詞)?什麼時候walk是名詞(例如: I have a five-minutes walk)又或者walks為動詞(He walks to classes everyday)。一樣按造邏輯,通常飯不會飛,所以flies應該是名詞。同樣的,walk作為名詞時,普遍是單數,因此是動詞的機率比較大。 語義 bank這個字在英文中有兩個意思,銀行或者岸。cotton bag 棉花袋可以是裝棉花的袋子或者棉花做的袋子。這種單字通常就依賴句子前後的內容。 談話 Bill要被檢舉了,and他叫了律師。“and”在這裡表示加上的概念還是一個原因?當然我們知道and應該被解釋為因此,所以等。然而電腦並不是這樣理解語言。他最有可能得知應該是"因此...

bot or not?

機器人還是人? 一個多月前的掏寶雙11,不知道大家有沒有看過一則影片,引言「雙11,我的設計師好像不是人」。這是阿里巴巴推出的人工智能設計師-魯班。 語言學,自然語言處理,計算語言學,人工智慧,人機互動,機器翻譯相關的內容實在太多了,但為何需要? 當我們在嘗試讓機器更像個人時,首先需要解決的是,如何人機器聽懂人的語言,不論是語法,比喻,又或著情感。 當人工智能遇上語言,遇上藝術,或有什麼樣的發展? 自動撰寫新聞 近年來,有相當數量的新聞是由電腦的人工智慧寫的。 目前有一家公司名為Automated Insights,簡寫剛好就是人工智慧(Artificial Intelligence)的簡寫--AI。這家公司推出了一套產品名為Wordsmith。Wordsmith主要工作就是用機器自動撰寫新聞稿件。其中美聯社(Associated Press)就有與Automated Insights合作。現在Wordsmith每年可以寫15億篇新聞稿。其中一部份的內容包括天氣預報以及運動賽事。 自動撰寫的新聞稿有什麼好處? 最明顯的就是面對突發事件時,電腦所擁有的速度。例如在地震時,電腦能即刻從地震台網的數據中獲得資料,迅速的生成英文報導全文。這時記者可能剛被震醒,現在他要做的就是把已經寫完的稿點擊發布。 機器寫詩 你有沒有想過,機器還能寫詩? 先來看看幾首詩,你認為是人寫的呢,還是機器寫的? 1.My Erotic Heart MY EROTIC HEART PANTS FOR YOUR ENCHANTMENT. YOU ARE MY KEEN TENDERNESS. MY AMOROUS DESIRE AFFECTIONATELY DESIRES YOUR LITTLE HUNGER. YOU ARE MY EAGER FERVOUR.. MY UNSATISFIED APPETITE. Bot or not? 2. Haiku This event's despairingly beautiful existence- To whom does it matter? Bot OR Not? 3.Crucifixion Xing THE worst thing that could happ...

台灣的空氣啊...

打噴嚏打到腦子壞掉 回台灣什麼都好,除了蚊子跟打噴嚏。 所以一個太認真去查了香檳跟桃園跟空氣品質指標 來源:空氣品質監測網 Credit: EPA 兩者對比之後,發現最大的差別在於PM10。香檳今年的數據並沒有PM10。 PM2.5科普 PM2.5 PM2.5 是指直徑小於等於2.5微米的顆粒物,可直接進入肺部。PM2.5沈澱近肺泡後無法消除,會對呼吸系統和心血管系統造成很大傷害,引起包括支氣管炎,哮喘等疾病。 PM10 PM10是直徑小於等於10微米的顆粒物,稱為可吸入顆粒物。最小的顆粒物可以達到咽喉,咽喉表面分泌的黏液會黏住它們。同時鼻腔內的毛絨也會阻擋這些顆粒物。到了程度,會吐痰,打噴嚏,咳嗽。但是,長期吸入也会引起呼吸系统疾病,如、咳嗽、誘發哮喘、慢性支氣管炎、慢性肺炎等。 因此在玉米田,過敏的徵兆好多了是因為少了這些可吸入顆粒物。結論是,能不能別再打噴嚏,我鼻子都要爛了QAQ

歧義--甲飽三粒

聊聊歧義這回事, 昨天把從美國帶的藥拿給了大阿姨,他們在看一天要吃幾顆,什麼時候吃。 吃飽後吃三粒藥 或著簡短的說「吃飽三粒」 用台語就是「甲飽三粒」,發現了什麼有意思的事呢? 可以解釋成「甲百三粒」吃一百三十粒,和「甲飽三粒」吃飽三粒 在解釋一個句子的時候,歧義可分為全面性歧義 (Global Ambiguous) 和暫時性歧義 (Local Ambiguous) 全面性歧義 指的是你讀完一個句子之後,還是覺得可以有其他解釋方式的。 例如:Put the candy in the box on the table 應該解釋為把放在箱里的糖放在桌上,還是把糖放在桌上的箱子裡呢? 暫時性歧義 則是當你讀完句子之後,發現其中的歧義可以被解釋的,又或者是暫時的歧義。 例如:The boat floated down the river sank. 當我們在閱讀這個句子時,我們一開始解讀,船延著河流往下,但當我們看到sank時,整句話的意思改變為沿著河往下的船沉了。 其中我們經歷了「花園路徑」。就像進到花園迷宮裡,一開始走錯路徑,但最終可以找到出口方向。 所以「甲飽三粒」是哪種歧義呢?

[隨寫]天黑請閉眼

你迷失了嗎? 在7度的夜晚, 在, 溫暖的, 窒息的, 安靜的, 空間裡, 有兩三百人與你度過, 光一直亮著, 直到越來越多人, 入眠。 是什麼遮住了眼, 讓你在黑夜裡行走呢? 禮讓的車子, 是你的保障嗎? 憑著本能, 憑著記憶, 走吧, 要多強大的光, 才讓你認清方向? 要多熟悉的路, 才不會撞上石頭? 錯了啊, 不需要光, 不需要熟悉什麼, 只需要, 你拿開眼睛上的遮蓋物, 看清你的前方。 往前千百步。

星巴克菜單的驚喜

大二上的時候在星巴克打工,剛開始的第一個禮拜,每天在背菜單。背咖啡,背食物的英文。太多陌生的詞彙,以至於點餐的時候不知道對方在說什麼。大概就是英文翻中文熟悉了一下之後繼續背英文的概念。但其實都是很日常的東西,點菜啊什麼的都需要。 寫這篇本來的計畫是以美國星巴克菜單為主,寫中英德翻譯。結果在翻譯的過程中,發現德國的星巴克網站上咖啡名並沒有變化。台灣的星巴克網站倒是中英都有。更有趣的是,食物基本完全沒有一樣的。 所以目前打算是以美國星巴克菜單為主翻譯成中文,然後針對單字翻譯成德文。 Coffee & Espresso 咖啡 & 濃縮咖啡   Ice Coffee  冰咖啡 Cold Brew  冷萃咖啡 Caffè Americano  美式咖啡 Espresso  濃縮咖啡 Caffè Latte  拿鐵 Caffè Mocha  摩卡 Caffè Misto  咖啡密斯朵 Cappuccino  卡布奇諾 Caramel Macchiato  焦糖瑪其朵 Flat White  白咖啡 Latte Macciato  拿鐵瑪其朵 ----  德文補充說明 Kaffee  咖啡 Mokka  土耳其咖啡 Milchkaffe  咖啡歐雷  Café au lait Frappuccino  星冰樂   (德國沒有星冰樂) Caramel Freppuccino  焦糖星冰樂 Java Chip Frappuccino  摩卡可可脆片星冰樂 Coffe Frappuccino  咖啡星冰樂 Vanilla Frappuccino  香草星冰樂 Strawberries & Cream Frappuccino  草莓星冰樂 Green Tea Frappuccino  抹茶星冰樂 Tea  茶   Chai Latte...

語言學家在幹嘛?

前幾天去圖書館翻了一本 The Phonology of Standard Chinese 來看,想說可以排解一下課上聲韻學的無趣,但讀了讀只覺得,「糟糕,我連自己母語的聲韻都搞不懂」。有趣的是,之前借這本書的某個人,在這個地方畫下重點,還寫上注音。原來在不知道多少年前,有個可能是台灣人的,拿著這本書在研究。 (我算是第一個在這本書上貼上借閱條的人,我有問說「我是第一個借這本書的人嗎?」圖書館員說只是之前借的人覺得不用借閱條罷了) 打開這本書的時候,閱讀了一下他的序,覺得很有意思,就嘗試翻譯給大家。 “  有一次我在一個派對,遇到了一位地理學家。在介紹完自己之後,他問「你學什麼呢?」     我回答「語言學」     他問「哪個語言?」     我聽到過這個問題非常多次了。我們知道語言是不同的。例如,貓在英文中是 [ kæt ],在中文中是 [ 貓 ]。這樣的差異是隨機的 ,任何語言都可以選擇任何聲音來表示一個東西。因為語言學家研究語言, 那他們肯定學了一些語言。     但對一個現代語言學家,卻有另種說法。儘管每個語言的確使用不同的聲音代表不同的物件,但這也是僅有的差異。不談詞典的話,語言有驚人的相似處。因此,對於一個現代語言學家來說,語言間的相似處比他們的差異更加有趣。     我們可以用比喻來描述這件事。每個國家的地貌可能看起來相當不同,但對於一個地理學家,每種地貌都可以用同樣的物理原理來研究。就像,每個國家的語言可能相當不同,但對於一個現代語言學家,我們可以用同樣的語言學原理研究他們。因此,問一個語言學家「你研究哪個語言?」就像問一個地理學家「你研究哪個國家?」儘管地理現象在每個國家是不同的,而且地理學家可能針對某個國家進行研究,但是主要的目的還是找出一個原理並應用在科學上。同樣的,一個語言學家所研究的並不拘限於一個語言。例如,一個聲調專家就會對不同語言的聲調感興趣。     但什麼證明了語言的規律就像地理原理而不是社會習俗,例如衣著的顏色,婚禮的傳統,體育規則,或著慶祝的方式?這已經是個久遠的問題,過去幾十年有大量的證明,尤其是在生成文法興起之後。有許多的規律出現在所有的人類語言中。例如,每個語言都有一組...