企业使用 AI 来改变其行业,从制造业到医疗再到教育;这一点甚至连普通观察者都清楚。但这一切转型的背后是开发人员构建解决方案并推动创新。这种演变发生的速度非常快,甚至专业人士和专家都很难跟上。幸运的是,没有人需要独自掌握 AI 开发领域;可以利用由社区和合作伙伴关系组成的整个生态系统。
此次讨论的合作者是身处 AI 和开发人员社区中的两家公司代表:英特尔的 AI 传道者 Paula Ramos ;和 Voxel51 联合创始人 Jason Corso 。Jason 还是密歇根大学机器人与 EECS 系的教员。他们讨论 AI 的走向,开发人员如何为 AI 的进步做出贡献,以及参与开发社区的重要意义 – 为了企业和行业以及开发人员本身的利益(视频 1)。
VIDEO
视频 1。英特尔和 Voxel51 的行业思想领袖讨论着在开发人员社区中促进参与的重要意义。(资料来源:insight.tech )
AI 空间如何演变,以及是什么趋势塑造了 AI 空间?
Jason Corso: 过去几年中,有一些重大发展推动了我们对 AI 的思考。第一个是这些大型语言模型的推出,可以捕获巨大的令牌长度并将自然人类语言嵌入模型中。这将为我们提供资源,让我们可以真正自然地交互。
我们还看到语言与视觉相结合是未来的一个关键趋势。这将带来全新的计算功能、公开可用数据,以及能够使用这些基本模型来,在 Voxel 称为“可视化 AI”中,解决新问题。
我想说的另一件事是,赞赏数据在各种 AI/ML 模型开发中发挥的作用。我们建立了这种文化,即模型为王。您在学校参加机器学习课程时,会开始使用所下载或教授给出的一些数据集来训练模型,大多数都侧重于算法。但 LLM 领域的领导者已经开始讨论数据、优秀数据、高质量数据在构建我们所用 AI 系统中的模型、代码和数据的结合中起着关键作用。
例如,在 Voxel,我们非常专注于数据所发挥的作用,并向开发人员提供工具,用于在模型中处理数据,而不是仅仅期待开发人员生成一些脚本来可视化数据。20 年前,我的数据集是数十个样本或数百个样本,对吧?现在,我们的数据集有几千万个样本。因此,实际管理数据集并理解失败模式和分布等等是非常困难的,我认为这需要全新的思维。
开发人员在 AI 进步中发挥什么作用?
Paula Ramos: 开发人员每天都在寻找自己的路径,因为一切瞬息万变。他们需要推动人工智能这个巨大领域的创新,因此他们需要富有创造力,以解决问题。也许我们面临与 20 年前相同的问题,但现在有更好的工具;有更好的解决方案。我们还需要更多地考虑应用程序的最终用户。
现在有一些挑战,我认为我们在模型开发、数据管理以及如何轻松部署这些模型方面仍有增长空间。您使用云系统,还是使用边缘解决方案?解决方案总是必须尽可能简单,这是开发人员目前面临的主要挑战。
此外,在这个领域真正重要的部分是开源社区;这正在改变 AI 的节奏。当我们向所有人开放这些模型时,他们可以访问数据集并逐轮改进这些模型。
开发人员与英特尔等公司合作的最佳方式是什么?
Paula Ramos: 我们现在拥有多个渠道和各种解决方案。例如,我们有硬件加速器,用于重新训练或微调模型。我们还有在边缘工作的解决方案。
还有开发人员可以访问的边缘参考套件。这是为复杂问题提供轻松解决方案的一种方式。而且我们在试图通利用教程、代码和视频,向他们展示如何浏览特定垂直领域:制造业、零售、医疗保健。也适用于 LLM,以及如何处理多个模型。
或者开发人员可以使用 OpenVINO™ 来优化和量化模型。这意味着他们可以使用与现有相同的基础架构,我们不会强迫开发人员购买特定硬件来运行模型,并且他们可以优化和量化 LLM。OpenVINO 还使开发人员能够轻松证明和测试这些 LLM。他们可以创建试运行,并提供示例,然后再转移到实际或最终生产系统。
我们有一个令人惊叹的存储库和开源社区,其中开发人员可以测试最新 AI 趋势。如果今天推出新内容,那么在两天之内,特定模型会显示在 OpenVINO 笔记本电脑存储库中。您可以在那里测试,例如 Llama 3.1、YOLOv10 和最新 AI 趋势。这是个很好的工具。
开发人员还可以访问英特尔开发人员云,测试多种硬件,再购买。这真的很酷。他们可以访问加速器和最新 AI 趋势,例如 AI PC。
Voxel51 如何与开发人员互动?
Jason Corso: 我们的软件称为 FiftyOne。它基本上是一个可视化组件,以及一个软件 SDK,用于完成我们在这里谈论的工作,例如数据和模型改进。但最近我们有了称为面板的新功能。您可以使用面板,为前端构建功能,而无需知道如何编写 React 或 JavaScript 或 UX 的东西。您可以直接在 Python 中编写,并且仍然可以增强 GUI 功能。
我们这家公司以开源为动力,但我们确实有数十名客户使用我们称为 FiftyOne Teams 的商业企业版 FiftyOne 软件,让您可以在团队、云中或本地中一起开发相同的功能。我们在制造业、安全和汽车领域拥有非常广泛的客户群。
我们今年早些时候结束了 B 轮融资,实际上我们招聘机器学习工程师等等人员,既填补核心工程工作,也填补开发人员关系工作。我们如此信任开发人员,所以我们雇佣受过充分培训、可以写论文和代码等的人,但他们的作用实际上是与社区建立桥梁。
行业活动如何帮助开发人员与更广泛的社区互动?
Jason Corso: Voxel 在 CVPR 之前举行了第一次面对面黑客马拉松。在这种参与中,我们看到开发人员很高兴与新技术互动,并真正试图在新团队中协同工作,以解决新问题。
这很有趣,但我认为开发人员活动的一个关键方面显然是教育。只有参加开发人员活动或会议,如 CVPR,才能真正与时俱进。去年我教了计算机视觉入门课程:从某种意义上说,我每周教三个小时,为 300 名学生举办这个开发人员活动,以了解计算机视觉。
但 AI 空间发展如此迅速,以至于似乎每个人都在不断收集信息,甚至在这个领域工作多年的教职员工。在各种事情上面紧跟最新趋势是不可能的,从尖端研究论文到您需要学习的新 API 和库等等。
因此,Voxel 试图做的是维护一种每周技术活动,真正让社区保持参与。例如,个人而言,东部时间周一中午,我都在办公,人人都可以在 Zoom 上登录。几周前,我们审查了某人的论文,然后我们浏览了幻灯片和实际技术模型。但这一切是这样的:“这是我第一次考虑进入计算机视觉。我应该关注哪些方面呢?
“因此,有关于基本功能的原始教育,以及开发人员活动,真正有助于互动,并且与时俱进。
是否有开发人员可以利用的其他可用资源?
Jason Corso: 正如 Paula 早些时候所说,开源是促进创新的门户。我们的软件 FiftyOne 在 GitHub 上,您可以分叉,然后提交 PR。我们每个月或两个月发布一次,每次发布都有来自我们社区的一些内容。自从我们发布以来,我们加深了对社区需求的了解,并在过去 4 年中得到了社区贡献。我真的想对我们建立的开发人员社区表示感谢。这是一个充满活力和丰富的环境,如果没有这个社区,我们不会成为今天的样子。
有实际活动,但参与开源项目才是真正参与 AI 开发人员生态系统的另一个好方法。
英特尔如何促进开发人员参与社区?
Paula Ramos: 在英特尔,我们一直在努力,我们正在创造多种方式,与开发人员一起创造这种创新。我们有一个巨大的生态系统,我们试图不仅触及推理部分,而且触及训练部分,例如通过异常检测。
我们有一个称为创新者计划的项目,让全球多名开发人员测试技术。他们可以制作自己的应用程序,然后与我们分享。基本上,他们创建自己的存储库,然后分叉他们的存储库,并创建新的应用程序。我将在我的 LinkedIn 和网络中重点介绍这些创新者,敬请关注。
我们参加的另一项活动是 Google Summer of Code(编程之夏),我们有几位开发人员与我们合作三个月,还有 OpenVINO 团队的不同导师。去年,参与 Google 编程之夏活动的一名学生与他们的导师一起发表了一篇关于 Anomalib 的论文。该论文提交给 CVPR 的视觉异常检查研讨会,并获得接受。
我们与大学的关系也发展迅猛,当然了,是帮助他们创建英特尔可以支持的研究和研究提案。我们还在通过会议,弥合了行业与学术界之间的差距。
我们真正希望在开源社区中工作,因为在这里最重要的是开发人员。我们总是认为,我们需要使开发人员能够在我们提供的软件中使用这种硬件,并且开发人员可以加速,以便他们可以改进他们的管道和工作负载。这是主要意图。
相关内容
要了解有关 AI 开发的更多信息,请听 AI 合作伙伴关系推动开发人员创新 。有关 Voxel 的最新创新,请关注 X/Twitter 上的 @voxel51 以及他们的 LinkedIn 和 GitHub 。有关英特尔的最新创新,请在 X/Twitter @intel 、LinkedIn 和 GitHub 上关注。
本文由文案编辑 Erin Noble 编辑 。