Name Description Link Author Domain Implementation
LeNet-5 LeNet-5 est le modèle qui a développé l'intérêt de la communauté pour les noyaux de convolution dans le traitement de données spatialement structurées comme les images. Plus Yann LeCun
Alexnet Le modèle Alexnet est le modèle qui a battu les autres algorithmes de classification d'images à la compétition ILSVRC 2012 en obtenant 16% de taux d'erreur là où les meilleurs concurrents ont obtenu 26% Plus Alex Krizhevsky Caffe (Filtre),
WaveNet Le modèle WaveNet développé par DeepMind est une avancée dans la synthèse vocale produisant des sons plus proches de la voix humaine que les TTS utilisés jusqu'à présent. WaveNet peut aussi générer des morceaux de musique ou encore d'autres sons. Plus DeepMind
pix2pix Image-to-Image Translation with Conditional Adversarial Nets Plus MIT team Torch (Filtre), TensorFlow (Filtre), Chainer (Filtre), pytorch (Filtre), Keras / Theano / TensorFlow (Filtre),
U-Net Ce réseau convolutionel est constitué d'une branche descendante de convolutions avec réductions (MaxPooling) puis d'une branche montante de déconvolutions avec UpSampling. Entre ces branches, des liens identité permettent de conserver l'information de localisation. Plus U-Net authors Caffe (Filtre), Keras / Theano / TensorFlow (Filtre),
Fast R-CNN Ce réseau détecte les objets en donnant en sortie les bounding box avec les probabilités par classe Plus Ross Girshick Caffe (Filtre),
Faster RCNN Basé sur Fast RCNN, c'est une implémentation encore plus rapide grâce au RPN (Region Proposal Network) Plus Faster RCNN authors Caffe (Filtre),
SSD : Single Shot MultiBox Detector Ce réseau améliore encore la rapidité de détection des images en discrétisant l'espace des boundingbox de détection Plus SSD authors pytorch (Filtre), Keras / Theano / TensorFlow (Filtre), Chainer (Filtre), TensorFlow (Filtre), MxNet (Filtre), Caffe (Filtre),
VGG16 et VGG19 les réseaux VGG sont à la base de beaucoup d'avancées dans le traitement d'images. En effet les premières couches de convolution avec MaxPooling ont permis d'atteindre un haut niveau de précision avec une architecture très simple. Ces premières couches déjà entraînées sont reprises dans de nombreux autres architecture pour profiter des tables de features calculées sur le dataset imagenet. Les réseaux VGG ont gagné le compétition ILVSRC 2014 dans les catégories localisation et classification. Plus VGG authors Keras / Theano / TensorFlow (Filtre), Caffe (Filtre), pytorch (Filtre),
ResNet : Deep Residual Learning for Image Recognition Vainqueur de la compétition ILSVRC 2015 et COCO 2015, la force de l'architecture ResNet réside dans l'utilisation de liens identité entre les entrée et sortie des différents  blocs constituant le réseau. Ces liens réduisent drastiquement le problème de gradient vanishing. Plus Yann LeCun pytorch (Filtre), Keras / Theano / TensorFlow (Filtre), Caffe (Filtre), TensorFlow (Filtre),
Inception L'architecture Inception est pensée pour réduire le nombre de paramètres. Plus Inception authors Keras / Theano / TensorFlow (Filtre), TensorFlow (Filtre), Caffe (Filtre), MxNet (Filtre),
MNC : Multi-task Network Cascades L'architecture MNC a gagné la compétition COCO 2015 MNC authors Caffe (Filtre),
SharpMask SharpMask est issu des labos du FAIR. C'est une amélioration de DeepMask capable d'effectuer de la segmentation de pixel. Plus SharpMask authors Torch (Filtre),