Аппаратное ускорение AI вычислений

Высоко­произ­водите­льные
вычис­ления на FPGA

   Наша специализация – создание FPGA-ускорителей глубоких нейронных сетей согласно парадигме Software-defined Compute. Наши решения адаптированы под специфику архитектуры применяемых ПЛИС, что позволило оптимизировать такие параметры как пропускная способность памяти и обеспечение низкой задержки вычислений для применения в промышленных приложениях реального времени и в финансовом секторе.

Наши дости­жения

Текущее решение для сетей RNN на базе FPGA Xilinx Ultrascale+ обеспечивает:

3.6 TFLOPs @ 550МГц

Реально достигнутая производительность при утилизации ресурсов FPGA по LUT в 75% (FP24DW)

менее 2500 нс

Задержка от входа до выхода на сети LSTM на частоте 550 МГц

~40 GFLOPs/Watt

При операциях в нашем проприетарном формате FloatPoint24DW

Наши решения

Каждый продукт заточен под решение своего класса бизнес-задач

Edge AI

Локальные вычисления

Cloud AI

Вычисления на облачных серверах

AI IP-cores

СФ-блоки для интеграции в FPGA/ASIC

Наша история

Краткая дорожная карта нашего развития

  • 2018

    Основание Deepware

    Тем субботним холодным утром несколько инженеров решили объединить свои усилия на стыке нескольких областей, в числе которых проектирование цифровых схем (FPGA, ASIC), опыт в ЦОС и нейросетях и жгучее желание сделать продукт, превосходящий существующие решения на базе HLS-инструментов.

  • 2019

    Решение для сетей LSTM для FPGA

    Наша пилотный проект: реализация рекуррентной нейронной сети. В рамках этого пилота была разработана библиотека вычислений в формате представления чисел с плавающей точкой FP24DW, оптимизированная под семейство FPGA Xilinx Ultrascale+. Данное решение для сетей LSTM на текущий момент превосходит существующие state-of-the-art реализации.

  • 2020

    Реализация CNN-сетей на FPGA

    Опыт работы с заказчиками показал, что часто используется комбинация из RNN и свёрточной нейросети. Для того чтобы сделать наше решение с CNN коммерчески доступным, в данный момент развиваем средства моделирования и оценки сетей при конфигурируемом квантовании каждого слоя.

  • 2021

    Выпуск компилятора для FPGA

    Поняв запросы индустрии и ИИ-инженеров, которые наравне с высокой плотностью вычислительной мощности и энергоэффективностью, ценят скорость разработки и удобство инструмента, мы решили обеспечить продукту максимальную доступность, понизив порог входа. В первую очередь мы нацелены на поддержку моделей нейронных сетей в форматах ONNX и PyTorch.

  • То ли
    еще
    будет!

НАПИШИТЕ НАМ

Расскажите нам о своей задаче:

Нажимая кнопку "отправить" Вы даёте согласие на обработку персональных данных на условиях, определенных Политикой