A03-17

 

高い頑健性を実現する形状認知とその形状表現メカニズム

Input Stimulus:

Berkeley Segmentation Dataset

 ほとんどのウェブページが画像であふれており、インターネットユーザーの多くは、画像をとおして情報を直感的に得るようになった. 人間は外界の情報の9割以上を見ることから得ていると言われている. しかし、画像に何が写っているかを理解することは、システムが最も苦手とすることであり、人間とのコミュニケーションにとって最大の障害となりつつある. あらゆるシステムやマシンに、人間と同様に画像を認知し、表現する能力を早急に持たせることが求められている.


 最近の研究によって、脳がもつ形状認知のメカニズムや、自然界にあふれる多様な形状を脳がどのように表現しているかということが判り始めている. 本研究では、人間のもつ認知の計算メカニズムや形の表現方法を情報学的に理解し、これを工学的に利することを目的としている.


 本研究では、自然画像に写り込んでいる任意の物体の領域を決めることに成功した. 今年度は、さらに研究を進めて、任意の形状をどのように表現すべきかを検討した.この結果、 中心軸表現が最適であることが判った. この表現方法を使うと、自然画像中の不規則で任意の形も、人工的な正方形や三角形と同程度の正確さで表現できることが示された。