田口 善弘 Yoshihiro Taguchi

理工学部教授

Professor, Faculty of Science and Engineering

背景モチーフ 背景モチーフ 背景モチーフ 背景モチーフ

情報科学を鍵に、生物と生命現象を物理学でひも解く
Study of living organisms and life phenomena using physics and information science

物理学者は長い間、生物を研究対象に捉えることから逃げてきたのではないだろうか。近年では、生命現象をモデル化する試みや、タンパク質の動力学などが研究されるようになりました。しかし、生命の本質への挑戦にはまだまだ及ぶところではありません。僕は、生命とは何かを、物理学で理解したいと考えています。そのために、DNAやタンパク質の持つ配列情報をデジタル情報と捉え、コンピューターで解析する「バイオインフォマティクス」という方法論が有効なのではないかと考え、その可能性を探っています。

Physicists have long ignored living organisms as research subjects. However, they have recently turned their attention to modeling life phenomena and protein dynamics. Nonetheless, these are far from life studies. On the other hand, my goal is to grasp the true meaning of life. For this reason, I believe that dealing with life as digital information embedded in DNA sequences and proteins, i.e., bioinformatics, will be the most effective method, and I will continue researching in this area.

背景モチーフ 背景モチーフ 背景モチーフ 背景モチーフ 背景モチーフ 背景モチーフ 背景モチーフ 背景モチーフ 背景モチーフ 背景モチーフ 背景モチーフ

Research 01

教師データ不要の機械学習で、少数サンプルをもとに長大なデータをひも解く

重要なファクターの推定

Unsupervised machine learning is used to reveal information hidden in large data sets using small sample sizes.

Inference of important factors

データからコンピューターが自動で学習し、その背景にあるルールやパターンを発見する主流の機械学習では、学習のために膨大な教師データを必要とします。対して、数学をもとにした、テンソル分解という手法を応用する機械学習は、教師データなしの学習によるデータ解析を可能とします。これにより、数万以上のデータを数個のサンプルで解析し、データの中に潜む重要なファクターを、的確に推定することができます。これは、長大な情報を有するDNAと生命現象の関わりの解明にも有効です。(独シュプリンガー社から著書出版)

Mainstream machine learning requires massive datasets with annotations to learn automatically from data and identify hidden rules and patterns. In contrast, using tensor decomposition based on mathematics allows us to analyze data from unannotated data sets. It also enables us to analyze data with tens of thousands of variables with a small number of samples; we can estimate important factors hidden in massive datasets. It is also useful when studying the relationship between life phenomena and DNA, which has a large amount of data (The book was published by Springer, Germany).

この研究が世の中にもたらす可能性

Research Possibilities: what the research create to the World

データマイニング業界

少数サンプルで高次元のデータ解析を必要とする場合に、新たな有効手段を提供し、顧客の拡大に貢献します。

Data mining industry

Even if I only have high-dimensional data from a few samples, I can use it to provide effective methods for increasing customers.

生命科学系研究・開発業界

遺伝子解析など、膨大なデータと時間を要する課題に対し、解決のための新たな手法を提案します。

Life sciences research and development industry

I can offer a novel method for solving tasks that require large datasets and time, such as genomics analysis.

Research 02

情報科学をインシリコ創薬やバイオマーカー探索へ応用する

医学にデジタルで挑む

Using information science to aid in silico drug discovery and biomarker identification.

Challenging medicine digitally

テンソル分解を用いた教師データを必要としない学習手法は、少数のサンプルから高次元のデータ解析が必要な際に有効です。例えば、DNAという長大な情報に潜む特定の疾患の原因遺伝子を、少数の症例から推定するといったゲノム科学は、絶好の標的分野です。臨床医らと協働し、この手法を用いて、遺伝子発現プロファイルを用いたドラッグリポジショニングや、バイオマーカー探索を行っています。

A machine learning method that employs tensor decomposition and does not require annotated datasets effectively analyzes high-dimensional datasets with small samples. The genomic science that infers a small number of disease-causing genes from a long DNA sequence based on a small number of cases is a good example. Using this methodology and collaborating with clinicians, we performed drug repositioning and biomarker identification from gene expression.

この研究が世の中にもたらす可能性

Research Possibilities: what the research create to the World

医療・創薬・化粧品業界

製品やサービス候補になる物質や処置があり、その効果を計測したゲノムデータ(遺伝子発現プロファイルなど)をお持ちの場合、または今後計測の予定がある場合、それらを用いて製品やサービスの改良、新規物質の発見などをサポートすることができます。

Medical/pharmacy /cosmetics industry

We can support the improvement of products and services and the discovery of new materials using genomic datasets (gene expression, for example), which measure the effects of products, materials, and services that may be commercially released.

Research 03

産業への応用も可能、複雑な製造プロセスの問題点を洗い出す

製造プロセスの故障検知

Identifying problems in complex manufacturing processes with industrial applications

Fault detection in manufacturing processes

複雑な製造工程を制御することは難しく、不良品が発生して歩留まりが悪くなったとしても、どこが悪いのか原因を発見するのは難しいものです。テンソル分解を用いた教師なし学習を用いれば、複雑な製造工程のどこに問題があるのか、少ない不良品のデータからでも洗い出すことができます。こうした、応用可能な分野の検討も行っています。

It is challenging to control the complicated manufacturing process, and even if defective products occur and the yield decreases, it is difficult to determine the cause of the problem. Using unsupervised learning through tensor decomposition makes it possible to figure out where the problem lies in a complicated manufacturing process, even from a small size of defective product data. I am also examining these potential areas of application.

この研究が世の中にもたらす可能性

Research Possibilities: what the research create to the World

製造業界

製造プロセスが長く、多数のセンサーによる記録はあるが、少数個の不良品が発生するという場合、どのセンサーの値を制御すべきか、どのセンサーの値の異常が不良品に繋がっているかを知ることができます。

Manufacturing industry

If the manufacturing process is lengthy and there are records from many sensors, but there are only a few defective products, then the sensor values that should be controlled and their abnormal values that result in defective products can be determined.

これまでの産学官連携事例

Collaborations

某大手製薬部門

A major pharmaceutical department

2019-

社員教育によるテンソル分解を用いた教師無し学習の技術移転

Technology Transfer of Unsupervised Learning with Tensor Decomposition by Employee Training

某培養細胞開発会社

Certain cultured cell development company

2020/9 –

テンソル分解を用いた教師無し学習を用いた培養細胞改良研究

Cultured cell improvement research using unsupervised learning with tensor decomposition

株式会社アストライアーソフトウエア

Astraea Software Inc.

2021/4 –

技術顧問契約

Technical Advisory Contract

某製造業

A certain manufacturing company

2022/9 –

製造プロセスの解析と改良

Manufacturing Process Analysis and Improvement

株式会社DGCテクノロジー

DGC technology Inc.

2013/1 –

解析技術提供と解析サーバ運用

Analysis technology provision and analysis server operation

実績

Achievements

2021-2022

表彰|Recognition

スタンフォード大学より、バイオインフォマティクスの分野において、上位2%の業績を有すると認定された。

2021.11

講師|Lecturer

行動心理学会・秋の行動計量セミナー「はじめての機械学習」

2021.4

論文|Journal

Y-h. Taguchi & Turki Turki, Mathematical formulation and application of kernel tensor decomposition based unsupervised feature extraction, Knowledge-Based Systems, Vol. 217, 106834 (2021)

経歴

Career

1984

東京工業大学理学部応用物理学科卒業

Tokyo Institute of Technology, Department of Applied Physics, Faculty of Science, Graduate School

1986

東京工業大学大学院理工学研究科物理学専攻修士課程修了

Tokyo Institute of Technology, Graduate School of Science and Technology, Department of Physics, Pre-doctoral Program

1988

東京工業大学大学院理工学研究科物理学専攻博士後期課程修了(理学博士)

Tokyo Institute of Technology, Graduate School of Science and Technology, Department of Physics, Doctoral Program (Doctor of Science)

1988-1997

東京工業大学大学院理工学研究科物理学専攻助手

Assistant Professor, Department of Physics, Graduate School of Science and Technology, Tokyo Institute of Technology

1997-2006

中央大学理工学部物理学科助教授

Associate Professor, Department of Physics, Faculty of Science and Engineering, Chuo University

2006-

中央大学理工学部物理学科教授

Professor, Department of Physics, Faculty of Science and Engineering, Chuo University

背景モチーフ 背景モチーフ