|
公司凝聚了素质高、技能强、深谙物流管理的人才,拥有经过专业培训的装卸队伍,积累了丰富的实践管理经验并提供良好的服务。
当前位置:官网首页 > 公司新闻 >
公司新闻
深度学习是解决所有 计算机视觉问题的最佳方案吗?
来源:act视觉系统设计 作者: 发布时间:2019-05-02 10:01 浏览量:


在2017年5月举办的嵌入式视觉峰会(Embedded Vision Summit)上,我有幸听到了加州大学伯克利分校的Jitendra Malik教授的一场精彩的主题演讲。Malik在计算机视觉领域拥有30年的研究和教学积累,他解释说,他一直对深度神经网络(DNN)对计算机视觉的价值持怀疑态度,但是在面对日益增长的令人印象深刻的结果时,他最终改变了主意。              



毫无疑问,DNN已经改变了计算机视觉领域。DNN在识别目标、在图像内定位目标以及确定哪个像素属于哪个目标等方面,都能提供更好的结果。即使是像光流和立体匹配这样的已经能用传统技术很好地解决的问题,现在也可以用深度学习技术获得更好的解决方案。深度学习的成功,远远超出了计算机视觉领域,它还涉及到语音识别等众多领域。              


由于这些令人印象深刻的成功,深度学习在科研和产业领域吸引了大量的关注和投资。这些关注和投资,正在加速深度学习算法和有效实施这些算法方面的进展,从而使深度学习技术能够集成到越来越多的系统中,包括那些具有显著的成本和功率限制的系统。              


深度学习真的适合所有问题吗?  

这自然就提出了一个问题:如果你正在将计算机视觉功能集成到你的系统或应用中,你是否应该考虑除了深度学习以外的其他任何技术?在我的咨询实践中,越来越多的客户希望通过深度学习来解决计算机视觉问题。但是我们发现,在某些情况下,其他类型的算法更合适解决问题。


为什么?                 


首先,视觉世界是无限变化的,系统设计者有无数种方法使用视觉数据。其中有一些应用案例,如目标识别和定位,都可以通过深度学习技术得到很好的解决。因此,如果你的应用需要一种算法来识别家具,那么你很幸运:你可以选择一种深度神经网络算法,并使用自己的数据集对其进行重新编译。              


我们要先谈谈这个数据集。训练数据对有效的深度学习算法至关重要。训练一个DNN通常需要数千个带标记的训练图像(即用所需输出标记的图像),以及数千个带标记的图像来评估候选训练算法。当然,这些数据的性质非常重要:训练和验证数据,必须能够代表算法要处理的情况的多样性。如果很难或者不可能获得足够多样化的训练数据,那么最好还是使用传统技术。              


考虑使用其他技术而非DNN的另一个原因是,如果你要执行一项计算机视觉任务,而在以往的报道记载中,尚未使用DNN算法来解决这样问题。在这种情况下,你可以尝试使用为其他目的而创建的现有DNN算法;或者你也可以尝试创建一个新的DNN算法来满足自身需求。不管怎样,你都是处在研究领域。这可能会令人望而生畏,因为很少有人和组织有开发新型深度神经网络算法的经验。而且,很难知道你是否能在可用的时间、精力和计算资源限度内取得成功。              


传统技术与DNN的结合   

当我们深入研究客户的需求时,我们经常发现,最初看起来像单一视觉问题的任务,往往可以分解为几个子任务。通常,在这些子任务中,自然有一些子任务是适合使用DNN解决的,而另一些子任务则不适合用DNN来解决。对于这些项目,结合DNN和传统技术的解决方案,通常是更好的选择,而不是试图将整个问题都强制转向DNN解决方案。              


记住机器学习技术是多种多样、变化多端的,这一点也非常重要。早在深度神经网络普及之前,其他机器学习技术(如支持向量机,SVM)就已经被用于解决很多视觉问题,并且今天仍然很有用。              


鉴于DNN在研究和技术方面的巨大投资,很明显,DNN作为首选解决方案的适用范围,将会继续迅速扩大。然而,在可预见的未来,许多应用将通过传统技术(包括其他形式的机器学习)或通过深度学习和传统算法的组合,来获得最好的解决方案。




有关传统计算机视觉技术、DNN以及混合技术(传统技术+DNN)之间如何权衡的问题,将会在2019年的嵌入式视觉峰会上,通过主题演讲、展示以及与专家进行一对一深度交流等方式,加以详细讨论。2019嵌入式视觉峰会将于5月20日至23日在美国加州圣克拉拉举行。在过去的六年中,嵌入式视觉峰会已经成为人们了解嵌入式视觉技术最新发展动态的卓越盛会。2019年,传统算法和DNN方法将再次成为峰会关注的重点。届时,将会有视觉和深度学习领域的90多名专家,包括来自Google、Cadence、MathWorks、TVision Insights、Purdue University、Harvard University、Micron、Strayos、IHS Markit、Strategy Analytics等产业界、学术界和市场分析机构的专家,将与会者分享最新的技术见解和市场趋势。会议的所有内容都聚焦于实用的、可部署的计算机视觉技术。这次峰会将来自大型学术会议(如CVPR)的理论与现实联系起来。会议现场还会设有来自60多家厂商的100多种现场展示,你将会了解最新的深度学习处理器和工具、面向低成本、高效实时视觉的优化软件以及针对快速产品开发的架构和服务等最前沿的信息。