弊社CMO 大下の執筆した「現場のプロが伝える前処理技術」についてインタビューしました

2020/09/28

2020年8月31日に出版された、弊社のCMO/最高数理責任者 大下が共著にて執筆した「現場のプロが伝える前処理技術」(副題「基礎から実践まで学ぶ テーブルデータ/自然言語/画像データの前処理」)について、インタビューをいたしました!



この度はご出版おめでとうございます。またご執筆おつかれさまでした!

まず今回「現場のプロが伝える前処理技術」を書くことになったきっかけを教えてください。


- 共著者の及川さんの紹介です


そうなんですね、ちなみに及川さんとはどちらでお知り合いになったんですか?


- ML系のフリーの勉強会です。その後、仕事の相談も何度かさせていただいていました。


機械学習の業界は勉強会はかなり活発とお伺いしていますが、

そこでの人脈が実際に仕事にも繋がっているんですね!

つぎに内容について、簡単に教えていただけますか?


- データ分析や機械学習のための、実際のデータ加工のプロセス(パイプライン)に沿った前処理の概説と実装についてです。


ありがとうございます、

ちなみにどんな人に読んでもらいたくて書きましたか?


- 想定読者になりますが、入社1-2年目で、概念的に前処理必要そうだなとわかったあたりの若手機械学習エンジニア、データサイエンティストが対象です。

- 別の言い方をすると、中級以上の人は対象じゃないので、読んでもツッコミしか出てこないかもしれないです。


なるほど、「若手機械学習エンジニア、データサイエンティスト」向けの、前処理・実装についての入門書・・・といった感じですね!

今後他に書いてみたいテーマなどありますか?


- 今回は、前処理にフォーカスした内容だったので、全体を通して実用的なテーマで書いてみたいです。


期待しております!

話は変わりますが、大下さんが執筆なさった箇所については「Chapter3 自然言語の前処理」と伺っておりますが、ブレインズコンサルティングにおいても自然言語のエキスパートとして活躍されていますね!自然言語の魅力や、この分野に興味を持ったきっかけはありますか?


- 元々、人間の論理思考の自動化として記号を扱う数理論理学とニューラルネットワークの融合を考えていて、記号(シンボル)つまり人工言語を扱う領域に近く、実用化しながら研究要素を組み込めそうな領域が自然言語だったというところ、自然言語を知らないのにその応用(1表象)の論理思考の自動化について語るのは恥ずかしいよね、という意識が興味に由来しています


最後にこれから「現場のプロが伝える前処理技術」を読む方にメッセージをお願いします。


- 全体を通して Colab で試せるようになっていますので、試しながら読んでいただければと思います。



インタビューありがとうございました!




オフィスにも献本いただきました!



★大下の著作部分は下記の通りです。


Chapter3 自然言語の前処理

 3-1 自然言語データ処理の基礎

 3-2 テキスト読み込み

 3-3 クレンジング

 3-4 形態素解析

 3-5 ベクトル化

 3-6 オーグメンテーション


出版社:マイナビ出版のご紹介はこちら

ご注文はこちら amazon


最新記事

すべて表示

大日本印刷での印刷物校正・校閲作業のAI活用にブレインズコンサルティングが協力

2019/05/28 ブレインズコンサルティング株式会社(本社:東京都 代表取締役社長:平瀬正博 以下:ブレインズコンサルティング)は、大日本印刷株式会社(本社:東京都 社長:北島義斉 以下:DNP)が実施する企業13社との合同検証に対して、AI技術を活用する取り組みに協力をしています。 DNPは印刷物等の制作の際に、法的な表示が義務付けられている事項や成分内容等が、正しく表示されているかなどをチ