
| 著者 | 吉田光男 |
|---|---|
| 発表日 | 2009-11-14 |
| 種別 | 会議発表論文 (Conference Paper) |
| 初出 | 楽天研究開発シンポジウム2009 |
| 共著者 |
乾孝司 山本幹雄 |
| 著作 | コピーライト |
| メタデータ | XML |
近年のWebページの増加により,Webページのコンテンツを利用するサービスや研究が盛んになってきている.
本論文では,Webページ集合を用いる事により,CSSセレクタで表現されたコンテンツ抽出ルールを自動的に獲得する手法を提案する.また,本手法のアルゴリズムを実装したソフトウェアを用いて実験を行い,日本語ブログサイトに対して適切な抽出ルールが獲得できた事を示す.
---
吉田光男, 乾孝司, 山本幹雄. CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得. 楽天研究開発シンポジウム2009, pp.7-10, 2009.


トラックバックURL : トラックバックをする場合はここをクリック
licensed under a