昨年1月から施行提供されている特許庁APIについて、その制度概要から実際に使用する方法まで
数回に分けて紹介したいと思います。まずは1回目、制度の概要について。
特許庁API試行提供制度のHPはこちら
そもそもAPIとは?
ざっくりいうと、「ソフトウェア同士が情報をやり取りする際に使用されるインタフェース」ということになります。
出典(Twilioブログ https://cloudapi.kddi-web.com/magazine/twilio-sms/what-is-api)
一般には、単にデータを取得するだけでなく、さまざまなAPIが存在します。
- クラウドAI (顔認識、自然言語処理 etc.)
- 銀行や決済システム(クレジットカード、paypay etc.)
- ECサイトの運営管理
- データベース
現状の特許庁APIは、出願番号の問い合わせに対して情報を返すのみのシンプルなアプリケーションです。
特許庁APIの仕組み
基本的な処理の流れは以下のようになります。
- 自身の作成したアプリケーションからAPIに対して認証用トークンの取得を要求
- 特許庁サーバーは正しいリクエストであるかを確認してトークンを送信
- ユーザのアプリケーションはトークンを利用して希望する情報(API)の指定と出願番号を送信
- サーバーは出願番号に該当する情報があれば、JSONまたはzipファイルにてレスポンスを送信
特許庁APIを使うメリット
私が試用して感じたメリットは以下の通りです。
- リアルタイムの情報を取得できる
- 取得が簡単
- ある程度のプログラミング知識があれば情報取得まではやりやすい
- 言語を問わず利用可能 (python, excel vba, node.js etc.)
- 特許庁提供の標準データからの自前のデータベース作成はコストがかかりすぎて現実的ではない
- 他のプログラムとの連携
- 特許事務管理プログラム、経過ウォッチング、データベースサービスなどで都度情報が必要なときに取得できる
- 言語は問わないので多くのプログラムに組み込める
- 民間データベースでダウンロードできないものが取得できる
APIと既存サービスの比較
特許庁APIの利用と既存サービスを比較してみました。それぞれ役割が異なる
ものなのでお互いの長所短所を補い合う利用方法になるかと思います。
JplatpatのAPIが利用できたら最強だとは思います…
- jplatpat
- ブラウザによるアクセスー人手による操作が必要
- インターフェース固定、一部ダウンロード機能あり(件数と項目に制限あり)
- 審査経過の情報はすべてブラウザで見られるが、CSVj, PDFダウンロードは不可
- バルクデータダウンロード
- xml, tsv形式による書誌事項、公報データの配布
- 過去データは膨大(数テラ単位)、配布は毎日
- データベースの構築、インターフェースの構築、日々の更新とコストが大きい
- 書誌事項に関してはすべての情報を含む
- 審査経過の情報は含むが、拒絶理由通知書や検索報告書などは配布されていない
- 商用データベース
- 有料のデータベース
- インターフェースは固定
- ダウンロード機能でまとまった件数を取得できる、項目も柔軟に指定できる
- 審査経過の情報は閲覧、取得できない
- 特許庁API
- データの取得に関してはリクエストを送るのみで簡単
- データ取得だけでもある程度のプログラミングは必要
- 現状大量のデータ取得やアクセスには対応していない
- 自身のプログラムに組み込んで情報の取得部分を自動化できる
- 拒絶理由通知書や審査経過は取れる
以上が制度の概要です。次回は具体的にどのようなデータがとれるのか、制度の利用方法等について解説します。