2008年9月22日 星期一

20080502 進度報告。

學生此次的進度,因為選修課程期中考及報告作業
先前所找的paper,大致上粗略看過

1.Extracting Spatial Knowledge from the Web,2003

提出一個系統,從收集的web pages當中擷取spatial knowledge
利用geospatial information extraction、concepts extraction技術
其中包含geoparsing(將地址找出來),geocoding(轉成座標)和keyword extraction等部份
2.Web-a-where: geotagging web content,2004

主要部份有三個:先是spotting(spotting place name candidates),再者是disambiguation(disambiguation spots),最後是foucs determination(其中包括許多演算法),用以tag individual place name。

3.Extracting Geographical Knowledge from the Internet,2002

conduct 3 series of experiments:tuned system、TiMBL Memory Based Learner和C4.5 Decision Tree Induction Algorithm.
paper中提出6種classes,每個class有各自對應的keyword以及相對應的pattern
像是city是一種class,有四種keyword(city、town、mayor、street),相對應pattern像是
city+of+x、x+city、town+of+x...等,再利用演算法找到比較match的pattern



這是目前看的情況,會找比較符合且可實作的部份先嘗試看看

沒有留言: