這次的Regular meeting是由我來報告
論文題目是Postal address detection from web documents
看這篇論文花費我蠻多時間,也看了幾篇參考文獻
到後來真的有種越看越懂的感覺,論文中提出的方法的整個流程也較清楚
閱讀論文除了需要花一些時間之外,如何從論文中學習、思考,甚至懷疑這樣的作法是否多餘
老師提到論文後半部份,是辨識地址的動作,有點Machine Learngin的概念
這個部份我又不太了解,登凱學長說Machine Learning的主要精神就是要利用正反兩個例子讓它學習
他也提到HMM的作法,來建立不同的model,HMM之前也曾在其他論文上看到,可是並不是非常理解
學長所提到的方法,也不失為一種嘗試,雖然我覺得這篇論文提出的方法好像蠻可行的
但也要看我現在用的javascript能否寫得出來
後來提到忽略空白的部分,萍華也有跟我提到regular expression的方法
我雖然也有用,不過還是有取到空白的部分,真是感謝萍華幫助。
所以感覺有點知道該怎麼做,不過還是先動手執行再說
HMM,Machine Learning也都要去了解,空白的部分要最先解決
還有,今天新生也加入meeting了,感覺實驗室生氣蓬勃呢
希望大家能一起努力,把研究搞定:)
沒有留言:
張貼留言