2008年9月22日 星期一

20080903 進度報告。

這周的進度主要處理以下四個部份:
1.Paper Reading的部分,將不了解的部分列出來。
2.可先建立地址架構,架構中各部分,利用不同patter來作match並找出片段。
3.從線上找到需要的城市洲名等資源。
4.Machine Learning可用在擷取pattern找不到的部分,所以這部份會在研讀論文後在進行。

首先,閱讀論文的部分,經過多次詳讀後,比起先前較有些概念(論文原文部分在此,HTML版)
論文中主要的部分在提出一個top-down relational algorithm ─ SRV .
不清楚的部分有幾個:
1.(page3)在SRV的sub title中的Search SRV,文中提到proceeds as... as few negative example as possible.學生想問正反面的例子為何負面要少,如果負面的例子也多會有怎樣的情況?
2.(page4)Procedure中提出random和LOUO兩種partition,主要的用意為何?
3.(page5)Results中提到OPD和MPD two cases不是很明白,Table3和Table4中的80%和20%的coverage是的意義為何?(Table3中的OPD有80%和20%的coverage,但Table4中MPD只有20%的coverage.)

接著在網路上相關的國家、省份、城市的資訊其實都可在維基百科找到
資料的來源其實很好找尋,目前也就這些資料開始建立資料庫。

另外,決定先建立地址架構,利用架構中的每個子部分去作pattern matching的動作
需決定每個子部份需要用哪些pattern去進行match
程式的部分進度較少,還在撰寫中,會盡快完成。

接下來,主要進度目標為:
1.將論文再詳細閱讀一遍
2.進行程式的撰寫(初步建立地址架構)
3.建立資料庫

沒有留言: