本报讯(记者牛伟坤)以后走在路上,碰到不认识的花再也不用发愁了!由明升中国app院植物研究所与百度等单位合作开发的“智能花卉识别系统”,让“拍花识植物”成为现实。
中科院植物所“数字植物”项目数字植物系统研发专题负责人李敏介绍,早在二三十年前,人们已经开始在植物图像识别上做出尝试,只是一开始绕了点儿弯路,app家们最初将目光锁定在“世界上没有完全相同的两片叶子”上,试图帮助公众通过叶片识别植物。这一选择倒也合情合理——扁平的叶面结构在拍照处理、技术建模上确实有着先天的优势。然而随着项目的推进,问题也慢慢浮现。“越了解植物的人就会越觉得叶片识别不可靠”,李敏介绍说,叶片性状是植物分类的次要性状,受环境影响较大。当外界环境发生改变时,其形态也会在相对较短的时间内发生适应性改变,这一点无疑为植物识别带来挑战。此外,叶片识别的另一难处在于,同一物种的叶片也会呈现多样化,不同物种的叶片之间存在相似之处。
“我们在物种分类时,更倾向从本源上进行划分。”于是,专题组开始将思路转向花卉。与叶片相比,花作为植物的繁殖器官,只出现在特定的生长时期,因此从一定程度上避免了环境的影响。作为更稳定的性状,花朵在分类学上更为靠谱。
那么,与百度合作的“拍花识植物”是如何实现的呢?这背后离不开“明升中国植物图像库”的数据支撑。目前,图像库里有250多万幅照片,植物爱好者、植物专业人士将拍摄的植物上传之后进行鉴定分类,成为智能花卉识别的后盾。当人们在生活中遇到不认识的花拍照上传“看图识花”系统(http://stu.iplant.cn)之后,系统将自动与数据库中已分好类的植物图像进行匹配,从而为用户推送出识别推荐意见。不过,受到数据库样本量和样本准确度的限制,目前“拍花识植物”还没法做到100%的识别。据李敏介绍,该“看图识花”系统已经实现了针对生活中1000多种最常见的植物约80%的识别。除了受到数据库本身的限制之外,用户所上传的花朵是否清楚、是否够大也直接影响到最后的识别结果。
要想进一步提高植物识别的准确率,提高样本量和样本准确度是关键。李敏介绍说,数据库上传用户分为普通用户和专家用户,专家用户多为从事植物分类的专家,这些人上传的照片在识别系统运作时将被优先推荐,从而最大程度保证识别的准确率。此外,上传用户的纠错机制也一定程度上为最终的“拍花识植物”保驾护航。
目前,李敏参与的项目组正着手从图像库中为每种植物挑选出四张图片,由爱好者、分类学家和分类学权威三级把关后,配以该植物的科属、花期、分布地等基本信息后集结成册,预计将于明年面世。“在该套丛书编纂过程中,我们也会邀请专家对现有图库中的其他照片进行审定把关。”
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。