トップ » 研究開発 » HTMLパーサ

HTMLパーサ

(2007/05/18)

HTMLパーサ&ルール

HTMLパーサ&ルールは、HTML文書からのデータ抽出をおこなうソフトウェアです。 プログラミングの素養がない方でも、「解析ルール」と呼ばれる抽出条件を設定することで、 HTMLパーサの機能を用いたデータ抽出が可能になります。 使用方法に関しては、「HTMLパーサ&ルールの使い方」をご覧ください。

ダウンロード

現在のバージョンは、Ver.0.1bです。

インストール

  1. Java実行環境(JRE)をインストール
  2. HTMLパーサ&ルールのzipファイルを展開する
  3. hpr.jarファイルを実行
1. Java実行環境(JRE)をインストール

HTMLパーサ&ルールのご利用には、Java実行環境 (JRE: Java Runtime Environment)が必要です。 Java.comのページからダウンロード、インストールしてください。

2. HTMLパーサ&ルールのzipファイルを展開する
3. hpr.jarファイルを実行

HTMLパーサ&ルールをダウンロードし、zipファイルを展開すると、 いくつかのファイル、フォルダがあらわれます。 このうち、hpr.jarが実行ファイルです。JREインストール後であれば、直接起動できます。

動作確認環境

  • Windows XP SP2 + JRE 1.6
  • Windows 2000 SP4 + JRE 1.6

使用ライブラリ

本ソフトウェアは、HTML Parser (http://htmlparser.sourceforge.net/、LGPL) を用いています。

使用許諾条件

  • 本ソフトウェアをダウンロードした者に対して、非独占的な使用権を与えます
  • 本ソフトウェアの使用による直接または間接の損害に対して、著作者および頒布者は責任を負わないものとします
  • 本ソフトウェアに対する一切のリバースエンジニアリング行為を禁じます
  • 本ソフトウェアの再配布は、当該文書を含めた頒布物を変更せず、無償で行う場合に許可を与えます

お問い合わせ

このソフトウェアは、ジューベー株式会社における技術開発の取り組みを示すために開発されました。 疑問点、カスタマイズの依頼、HTML文書のデータ移行など各種のお問い合わせは、 弊社お問い合わせページ をご覧ください。

前:HTML文書からのデータ抽出 | 次:HTMLパーサ&ルールの使い方

  1. HTML文書からのデータ抽出
  2. HTMLパーサ&ルール
  3. HTMLパーサ&ルールの使い方