退屈なことはPythonにやらせよう

投稿者: | 2018年11月18日

知財の人のためのpython入門の参考書にした書籍。初心者でも業務の効率化を図ることができる実践的な入門書。

最初の6章はごく基本的なpythonの文法解説でif文や変数、四則演算などからイテレータ、ディクショナリーの辺りまでを説明。そしてそれが終わると具体的な処理「退屈なことの自動化」を目的とした解説に。内容としては

  • 正規表現
  • ファイル読み書き
  • スクレイピング
  • エクセル、PDFなどのファイル操作
  • CSVの扱い

などが挙げられている。特許データを処理するときに非常に有効なものばかり。特に正規表現は覚えたら確実に業務の効率化に役立つのではないかと思う。特許データベースから取得した公報番号、特許分類、全文データなどのCSVやテキストファイルからの情報抽出などに自分も役立てているので是非皆さんも使えるようになって欲しいと思う。

ただ残念なのは基本的な文法の説明が6章で終わっていきなり正規表現が登場する点。独学でやっている人は絶対ここが大きなハードルになると思う。真面目にきっちりやる人ほどつまずいて、ここをアバウトにやれる人の方が先に進めそう。自分もいまだに正規表現は試行錯誤しながらパターンを考える(逆にスラスラ書ける人も見たことがない)ので都度その時の問題だけが解決すればよしくらいでいいんだと思う。なのでpython入門では要所に触れつつ実際の処理するデータを見せて試行錯誤してもらうのがよいのではと考えている。

全部通して独学でやるにはボリュームもあるしかなり大変なのではという感想。でも身近な業務でも起こりそうな具体的な問題を解決するという意味では身につけたことがすぐに活かせるのでモチベーションも高まるのではないでしょうか。しばらくこれで私も勉強します。

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です