为.NET打开新大门：OpenVINO.NET开源项目全新发布

2024-02-10码农

前言

在AI的应用越来越广泛的今天，优化深度学习模型并进行推理部署已经成为了一门必要的技术。

Intel开发的OpenVINO工具包（Open Visual Inference and Neural network Optimization）就是这样一款强大的工具。

作为一个开源的工具包，OpenVINO为开发者提供了强大的深度学习模型优化和推理功能，支持跨不同的Intel硬件平台进行部署，包括CPU, 集成GPU, Intel Movidius VPU, 和FPGAs。

该工具包的初衷就是实现一处编码后，能在任何地方部署的机器学习推理的解决方案。然而在与深度学习模型推理打交道的过程中，我逐渐发现原本我基于百度飞桨paddlepaddle开发过的PaddleSharp项目在CPU推理OCR性能方面，同样的模型，OpenVINO的性能更胜一筹。于是我开始关注OpenVINO，发现它的C API对于.NET世界来说并没有一个合适且高质量的封装。

市面上的一部分封装可能只是为了满足特定项目的需求，功能不够完善；有些虽然功能完善但命名规范可能不符合.NET社区规范；有些在错误处理和性能方面存在问题，或者无法做到跨平台，这与OpenVINO的跨平台性矛盾。

.NET世界亟需一个更高质量的OpenVINO封装，而我感觉我有能力去努努力。因此，我在今年的节前立下了flag——国庆期间大干一票，开始了OpenVINO.NET的开源之旅。

地址：https://github.com/sdcb/openvino.net

包名	版本号	简介
Sdcb.OpenVINO	.NET PInvoke
Sdcb.OpenVINO.runtime.centos.7-x64	CentOS 7 x64
Sdcb.OpenVINO.runtime.debian.9-arm	Debian 9 ARM
Sdcb.OpenVINO.runtime.debian.9-arm64	Debian 9 ARM64
Sdcb.OpenVINO.runtime.rhel.8-x64	RHEL 8 x64
Sdcb.OpenVINO.runtime.ubuntu.18.04-x64	Ubuntu 18.04 x64
Sdcb.OpenVINO.runtime.ubuntu.20.04-x64	Ubuntu 20.04 x64
Sdcb.OpenVINO.runtime.ubuntu.22.04-x64	Ubuntu 22.04 x64
Sdcb.OpenVINO.runtime.win-x64	Windows x64

Q: 为何 OpenVINO.NET 没有直接引用 OpenCvSharp4 ？

A: 我个人很喜欢 OpenCvSharp4 ，开源协议很友好，但一来 OpenCvSharp4 官方支持的平台不够多，且有些人可能更喜欢 Emgu.CV 或 ImageSharp ，尽量不做绑架为好

Q: C API有158个函数接口、26个接口体，也写了详尽的 XML 注释，是怎么在短时间内高质量地做到的？

A: 我是自动生成的，我使用了CppSharp项目，CppSharp将C API的头文件内容转换为抽象语法树(AST)，然后我将这些AST转换为XML注释详尽的 C# 代码。其实我已经不是第一次将CppSharp应用到开源项目中，有兴趣的朋友可以看我Github Sdcb.OpenVINO.AutoGen这个项目了解实现的细节。

为想了解如何使用的朋友，我还写了基于 yolov8 的检测和分类的推理示例， OpenVINO 官方的人脸检测示例以及我为它原生设计和迁移的 PaddleOCR 项目。另外我还想畅谈一下项目的设计思路和未来的发展方向。

四个示例

人脸检测 - 基于OpenVINO官网提供的face-detection-0200模型

我这个示例中使用的是OpenVINO官网提供的 face-detection-0200 模型，官网提供了介绍页面：https://docs.openvino.ai/2023.1/omz_models_model_face_detection_0200.html。详尽的示例代码可以从我创建的mini-openvino-facedetection这个Github仓库找到，运行时，它会将摄像头中定位人脸位置并框出来，效果图如下：

如图，检测出了3个物体，画面中的人、手机和水杯，总耗时约30ms。

物体分类 - 基于yolov8的分类模型

yolov8模型提供了1000种不同的预定义分类，和上面的模型一样，需要从yolov8官网下载并转换，只想快速尝鲜的朋友可以直接打开我写的另一个Github示例：sdcb-openvino-yolov8-cls运行时，代码会读取一张图片，然后尝试推测出该图片最像1000种分类中的哪一种，在我的代码示例中，输入图片为hen.jpg：

输出如下：

classid=hen, score=0.59 preprocess time: 0.00ms infer time: 1.65ms postprocess time: 0.49ms Total time: 2.14ms

using OpenCvSharp; using Sdcb.OpenVINO.PaddleOCR.Models.Online; using Sdcb.OpenVINO.PaddleOCR.Models; using Sdcb.OpenVINO.PaddleOCR; using System.Diagnostics; using System; FullOcrModel model = await OnlineFullModels.ChineseV3.DownloadAsync(); using Mat src = Cv2.ImDecode(awaitnew HttpClient().GetByteArrayAsync("https://io.starworks.cc:88/paddlesharp/ocr/samples/xdr5450.webp"), ImreadModes.Color); using (PaddleOcrAll all = new(model) { AllowRotateDetection = true, Enable180 classification = true, }) { // Load local file by following code: // using (Mat src2 = Cv2.ImRead(@"C:\test.jpg")) Stopwatch sw = Stopwatch.StartNew(); PaddleOcrResult result = all.Run(src); Console.WriteLine($"elapsed={sw.ElapsedMilliseconds} ms"); Console.WriteLine("Detected all texts: \n" + result.Text); foreach (PaddleOcrResultRegion region in result.Regions) { Console.WriteLine($"Text: {region.Text}, Score: {region.Score}, RectCenter: {region.Rect.Center}, RectSize: {region.Rect.Size}, Angle: {region.Rect.Angle}"); } }

运行效果如下：

elapsed=246 ms Detected all texts: 高速4X4160MHz数据流 5GHz频段流数多一倍速度快一倍3 AX5400无线规格的路由器， 5GHz频段采用高速4X4160MHz数据流，相比市面上主流的AX3000路由器（2X2数据流） 5GHz频段流数多一倍，速度快一倍。 ...

如果你发现这个项目有用，或者正在使用它，我非常欢迎你能去我的项目主页上给我一个star🌟，这对我将会是巨大的鼓励！你们的使用经验和星标都是我继续进行.NET开源项目工作的动力！

转自：.NET骚操作

链接：cnblogs.com/sdflysha/p/20231015-sdcb-openvino-net.html