CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得

  • Twitter
  • Facebook
  • Yahoo!ブックマーク
  • Google ブックマーク
  • Delicious
  • livedoor クリップ
  • はてなブックマーク

document data

著者 吉田光男
発表日 2009-11-14
種別 会議発表論文 (Conference Paper)
初出 楽天研究開発シンポジウム2009
共著者 乾孝司
山本幹雄
著作 コピーライト
メタデータ XML

要約(サマリー)

近年のWebページの増加により,Webページのコンテンツを利用するサービスや研究が盛んになってきている.
本論文では,Webページ集合を用いる事により,CSSセレクタで表現されたコンテンツ抽出ルールを自動的に獲得する手法を提案する.また,本手法のアルゴリズムを実装したソフトウェアを用いて実験を行い,日本語ブログサイトに対して適切な抽出ルールが獲得できた事を示す.

---
吉田光男, 乾孝司, 山本幹雄. CSSセレクタで表現されたコンテンツ抽出ルールの自動獲得. 楽天研究開発シンポジウム2009, pp.7-10, 2009.

参考文献目録

paper

コメント

ログイン もしくは 利用登録

トラックバック

トラックバックURL : トラックバックをする場合はここをクリック

埋め込み用ソース

ページトップへ