Todos os testes foram realizados no rock-5b-plus_bookworm_kde_b2.output.img.xz imagem.
O ROCK 5B+ é um computador de placa única (SBC) de precisão baseado no SoC RK3588 com uma NPU de potência computacional de 6 TOPS para uma variedade de aplicações de IA. Embora o 6 TOPS possa lidar com um grande número de tarefas de visão de IA, cenários de aplicativos que exigem maior poder de computação podem exigir uma atualização. Neste caso, emparelhando o ROCK 5B+ com o DEEPX DX-M1 O módulo acelerador de IA M.2 adiciona um impressionante poder de computação de 25 TOPS, permitindo que o ROCK 5B+ lide com cargas de trabalho de IA ainda mais exigentes.

Fig.1 Visão geral do produto DX-M1
O módulo DX-M1 desenvolvido pela DEEPX é conectado ao ROCK 5B+ através da interface M.2 e a comunicação de dados é feita através do ROCK 5B+ PCIe. O módulo é otimizado para acelerar tarefas de inferência para modelos convertidos para o formato dxnn usando o DXNN® – Software DEEPX NPU (SDK).

Fig.2 Arquitetura do SDK DXNN
DXNN® – Software DEEPX NPU (SDK) inclui uma variedade de ferramentas: DX-COM (Model Conversion), DX-SIM (Model Simulation), DX-RT (Runtime), DX-NPU Driver (Device Driver) e DX-APP (Sample Code). Com o DXNN, a implantação de modelos de aprendizado profundo no hardware DEEPX AI se torna eficiente e fácil, além de aproveitar seu alto desempenho.
Instalação de hardware
Insira o módulo DX-M1 no slot M.2 do ROCK 5B+ e ligue-o. O ROCK 5B+ tem dois slots M.2 na parte inferior, portanto, mesmo com o DX-M1 instalado, outro SSD pode ser instalado, se desejado.

Fig.3 Diagrama de instalação do DX-M1
Após inicializar o sistema, confirme o reconhecimento do dispositivo PCIe.
![]()
Fig.4 Resultado da detecção do ROCK 5B+ PCIe
Após instalar o driver DX-NPU, o módulo DX-M1 deve ser reconhecido corretamente no ROCK 5B+.

Fig.5 Verificação de status DX-M1
Avaliação de desempenho do YOLOv5s DXNN
O componente DX-RT facilita a inferência para dxnn modelos. Para avaliar o desempenho do modelo YOLOv5s no DX-M1, usamos o run_model ferramenta de referência.
A latência de inferência no ROCK 5B+ via DX-M1 inclui três estágios: Latência = PCIe I/F (Tempo de gravação) + NPU (Tempo de inferência) + PCIe I/F (Tempo de leitura).

Fig.6 Análise de latência DX-M1
# run benchmark
run_model -m YOLOV5S_3.dxnn -b -l 1000

Fig.7 Resultados do benchmark YOLOv5s DXNN
O tempo médio de inferência é de 4628,91 μs, ou seja, 216 FPS, após 1000 induções na NPU de núcleo único do DX-M1. Com três núcleos NPU, a velocidade máxima teórica do DX-M1 é de 648 FPS, o que está muito próximo do resultado de referência de 645.476 FPS.
Detecção de fluxo de vídeo de 30 canais YOLOv5s
O pacote de software DX-APP inclui diversas demonstrações de visão computacional que podem ser rapidamente implantadas no DX-M1 para tarefas como detecção e segmentação de objetos. Neste exemplo, o Radxa realiza detecção de objetos em 30 fluxos de vídeo simultaneamente usando o ROCK 5B+ e o DX-M1. O ROCK 5B+ decodifica vários fluxos de vídeo, envia os dados para o DX-M1 para inferência e, finalmente, processa a saída. Vale ressaltar que o DX-APP recomenda usar o opencv 4.5.5, mas como a versão FFmpeg do sistema ROCK5B+ não é compatível com o Opencv 4.5.5, compilamos a versão 4.10.0 mais recente aqui.
# run multi-stream object detection
./bin/run_detector -c example/yolov5s3_example.json
Inferência de vídeo NPU de núcleo único de 30 canais FPS: 240 FPS.

Fig.8 ROCK 5B+ Saída de detecção de NPU de núcleo único de 30 canais
Conclusão
Emparelhar o ROCK 5B+ com o módulo DEEPX DX-M1 AI é uma melhoria significativa para usuários que exigem recursos de IA de alto desempenho em um computador de placa única. A adição de 25 TOPS de poder computacional abre novas possibilidades, permitindo que o ROCK 5B+ lide com eficiência com tarefas exigentes, como detecção de objetos multifluxo e inferência de alta velocidade. Essa combinação mostra o potencial do ROCK 5B+ como uma plataforma robusta para cargas de trabalho de IA em computação de ponta, oferecendo flexibilidade e potência. Com ferramentas como DXNN SDK e suporte de hardware para aplicações intensivas, o ROCK 5B+ e o DX-M1 fornecem uma solução valiosa para desenvolvedores e indústrias focadas em IA e visão computacional.