Notre architecture est multi-process mais assez monolithique au sens « self-contained ». 19/12/2018. Fondée en 2013 par Florian Douetteau, Clément Stenac, Marc Batty et Thomas Cabrol, Dataiku est On est dans une logique d’éditeur et pas de conseil mais on fait de l’enboarding & de l’expertise. C’est pas magique ! On réfléchit à passer sur un bus de messages mais ça suppose de l’embarquer ce qui n’est pas simple car il faut gérer toute la chaîne autour et le sécuriser. Sylvain Utard : Quand j’ai rejoint Algolia, il y a 7 ans, nous étions trois, avec les deux fondateurs. Avec Spark c’est déjà distribué évidemment mais il y a encore beaucoup de monde qui fait du python « classique » qui n’est pas distribuable facilement à cause de l’environnement, de la versatilité et des conflits de libs. Quelle est la différence ? Sur quels noeuds du cluster Hadoop/Spark la solution sera-t-elle déployée ? La problématique est plutôt l’explicabilité que la performance brute : certains sont très performants mais on ne sait pas expliquer comment ils marchent. Cuisine, Cloud Architect @Microsoft | #startups make my heart beat | Author http://souslecapot.net  | Board @duchessfr #womenintech Coloriages, Dataiku a été fondée en 2013 à Paris par quatre co-fondateurs : Florian Douetteau, le PDG actuel, est l'ancien directeur de la R&D de l'éditeur français de moteur de recherche Exalead, société d'où est également issu Clément Stenac, un des trois autres cofondateurs . Restaurant, Horoscope, Le dev pourra coder dans un environnement de très haute qualité (versionnement, traçabilité du code) : on voit souvent des projets où les data scientists ont des dizaines de scripts un peu dans tous les sens : dans notre solution tout est rationalisé. J’ai commencé en tant que dev, puis j’ai évolué : lead dev, architecte et finalement responsable du produit à la R&D. C’est une équipe plutôt restreinte ! On reste guidés par cette contrainte de déploiement chez le client : il faut que ce soit le plus simple possible et que le client puisse redémarrer la solution facilement en cas de problème. Hadoop contient beaucoup de composants assez épars qui sont édités par des équipes différentes de sociétés différentes qui sont parfois en compétition entre elles. Avant de fonder Dataiku j’ai travaillé pendant 6 ans chez Exalead qui édite un moteur de recherche. Qui décide de l’évolution du produit ? On ne peut pas se connecter sur la machine pour aller voir les logs comme cela serait le cas dans une solution SaaS : donc on a développé beaucoup d’outils de diagnostic et de safety check. Ca crée des problèmes de confiance dans l’algo lui-même et surtout ça commence à poser des problèmes légaux : la GDPR commence à approcher ces sujets. On commence à arriver à une taille d’équipe où les problèmes de management se posent de façon plus aigüe. Exalead - Ingénieur R&D Paris 2006 - 2013. BOULOGNE. Quels outils utilisez-vous pour l’industrialisation ? Dans les faits j’ai été plutôt autodidacte : je contribuais au projet opensource VLC media player : à l’origine c’est un projet issu de l’école Centrale. Notre moteur de ML s’appuie sur 5 librairies dont 4 sont open-source: scikit-learn (python), xgboost (python), MLlib (Spark), H2O (Spark), le ML intégré à Vertica. Quelle est la répartition des profils techniques parmi vos employés ? Clément STENAC. Lire la suite. Bricolage, On adresse les problématiques de contrôle d’accès, de versionning, pouvoir revenir en arrière, éviter les conflits. Additionally, Clément Stenac has had 1 past job as the Chief Architect and Head of Product R&D at Exalead. Actualités, Les dernières infos à propos de Clément Stenac. Créée en 2013, la société propose une solution collaborative de gestion des données en entreprise. Chaque distri fait ses choix, patche différents bugs, … parfois les versions ne sont pas les mêmes suite à un repatch. → Watch the Full Video for a Complete Overview of the 5 Main Challenges 1. On a un gros bouton « generate report » dans l’UI qui permet de générer un  zip avec toutes les infos de contexte qui nous servent à comprendre ce qui s’est passé et quel bug ça a triggé ou quel bouton bizarre le client a touché dans son Hadoop ! Comme outil d’intégration on utilise Jenkins. Ou c’est l’utilisateur qui va choisir telle forêt, telle régression…. Evidemment on fait aussi beaucoup de veille pour devancer l’adoption de nos clients. Tout ne marche pas toujours mais on a un très bon niveau de support avec une excellente satisfaction. Où se situe réellement votre valeur ajoutée ? | Hi @Clément_Stenac , perfect thanks, its works, so is there any recommendation to use. Organization Name . Tech. Par exemple un référentiel renseigné et modifié par le marketing permettrait de déclencher tout le pipeline de traitement. Dataiku regroupe 110 employés dont 70 en France, le reste aux US et UK et 1 personne à Singapour. Nous sommes une startup et convaincre nos clients de nous confier l’hébergement de leurs données reste compliqué, surtout que notre stratégie commerciale est axée sur les grands comptes, y compris à l’international. I hope I helped! La solution se vend par abonnement et donc il faut assurer le renew. Certains algos comme le clustering  ont aussi été développés maison car on voulait proposer une expérience interactive très spécifique. Avec Dataiku on s’adresse à différents types de profils. On a trop tardé sur l’adoption de certaines nouvelles technos : ça nous a coûté des clients. Dataiku vend un logiciel en Saas (software as a service, une plateforme logicielle sur abonnement) baptisé DSS, pour L'actualité de Clément Stenac. Par cette opération, la start-up devient «éligible» au statut de licorne. Dataiku (Clément Stenac) Released: 2015/11/13: Last updated: 2020/05/25: License: Apache Software License: Source code: Not yet released: Reporting issues: Github: How To Use . Dataiku was founded in 2013 by Douetteau and three fellow Frenchmen: Marc Batty, Clément Stenac and Thomas Cabrol. Quel était le produit, le concept, de Dataiku ? SMIC, Start-up & Co: Dataiku, le spécialiste du big data - 09/06 Clément Sténac, co-fondateur de Dataiku, a dévoilé la stratégie et les objectifs de développement de son groupe. A l’été 2012 j’ai senti que c’était la fin d’un cycle : on venait de refactorer le produit et l’ambiance n’était plus vraiment celle d’une startup suite à notre rachat par Dassault Systèmes. On peut reprocher beaucoup de choses à Hadoop mais une des grandes forces du composant yarn c’est de pouvoir déployer du traitement sans rien avoir de spécifique à installer sur les nœuds eux-même. Je pense notamment à la gouvernance et la traçabilité, s’assurer que les données sont bien sauvegardées et que les accès sont centralisés pour éviter la fuite des données : une problématique typiquement GDPR. Après Exalead, Florian travaillait chez Criteo et IsCool: son constat était que tous les outils pour faire de l’analyse de données existaient en open-source, mais les brancher tous ensemble c’est compliqué et cela nécessite beaucoup de travail de plomberie. Clément Stenac, Dataiku : « L’explicabilité des algorithmes devient plus critique que leur performance », Voir tous les articles par Stéphanie Hertrich, Laure Némée, MANGOPAY : « J’évite de me jeter sur les dernières technos si ça ne sert pas le business », Emmanuel, Alexis, Datadog : « On est dans un no man’s land entre de très gros comme Google et le reste », J’ai testé : Etre une femme tech chez Microsoft, Patrick Chatain, VP Engineering chez ContentSquare : “penser davantage amélioration continue que révolution constante”, Julien Lemoine, CTO d’Algolia : “on optimise dans un ordre de grandeur de la milliseconde”, Stéphane Alizon, CTO de Younited Credit : « Tout notre S.I a été développé en interne, from scratch ». Et pourtant je manipule toutes ces choses compliquées en python. J’ai fait une école d’ingénieur : Centrale avec l’option informatique. Est-ce que l’on peut « débrayer » l’usage de votre solution a posteriori ? On a cet aspect data lineage qui donne une forte garantie aux utilisateurs que la donnée a été calculée selon le bon traitement et que ce n’est pas une donnée obsolète qui ne serait pas nettoyée de la bonne façon. Pour l’instant c’est du synchrone avec des API http mais avec une sur-couche à base de polling qui permet de l’utiliser en asynchrone. On n’aurait jamais voulu avoir notre cœur écrit en python ou en ruby par exemple ! Semi-automatiser le débug a été un gros investissement de développement de notre part. La qualité du support fourni à nos clients. On n’héberge pas de prod mais beaucoup d’infra de test qui se fait chez OVH et Online. Plus de détails avec Clément Sténac, le cofondateur. Cela leur libère du temps pour se consacrer au machine learning, au traitement avancé. CB Rank (Hub) National Taiwan University Alumni … Mais une société dont ce n’est pas le métier premier : un retailer de taille moyenne, une utility ou un grand compte quel qu’il soit, ne pourra pas aussi facilement tout inventer et tout créer from scratch, il leur faudra des outils. Cela permet aux clients qui sont dans le Cloud de démarrer encore plus facilement. PITCH. La capacité de faire des applications web de visualisation sans avoir à monter des serveurs, des load balancers. Data science : méga-levée de 101 millions de dollars pour les Français de Dataiku. Quand on arrive chez nos clients, Hadoop est un peu comme un gigantesque panneau de contrôle d’avion et on ne sait pas trop quels boutons ont été touchés. In this blog post, we will go over three of the five key challenges presented by Dataiku Chief Technology Officer Clément Stenac during the 2021 Dataiku Product Days. J’étais déjà très tourné backend sur des sujets data, big data et je me suis rapidement intéressé aux problématiques de scalabilité. C’est un logiciel que les utilisateurs téléchargent et installent dans leur infrastructure : pour beaucoup c’est le cloud mais pour une bonne majorité c’est encore leur datacenter : c’est presque du 50%-50%. Vous partez de l’acquisition de la donnée : proposez-vous des solutions simplifiées pour l’acquisition de celle-ci ? Thème : Baskerville 2 par Anders Noren. 2 « Dataiku veut conquérir le marché américain avec ses analyses prédictives », Interview de Clément Stenac, cofondateur de Dataiku par FrenchWeb.fr (Olivier Harmant), 15 juin 2015. Code or Click : Hadoop permet effectivement d’intégrer les composants entre-eux, mais ça reste destiné aux développeurs. Open your dataset in an analysis or prepare recipe and search for the Anonymize data processor. Avant de fonder Dataiku j’ai travaillé pendant 6 ans chez Exalead qui édite un moteur de recherche. Il n’y a pas de choix rationnel fort pour notre hébergement : historiquement on était surtout chez AWS mais on fait de plus en plus d’Azure, notamment pour nos besoins lors des formations. Ensuite on a eu les technos de Sql over Hadoop : Hive, Impala, Pig qui apportaient la simplicité avec SQL mais la perf restait moyenne et surtout on reste cloisonné. C’est évidemment cette expérience chez le moteur d’indexation et de recherche qui l’incite à monter son propre business. On est essentiellement drivé par les remontées clients. Déco, Fondée par Marc Batty, Thomas Cabrol, Florian Douetteau et Clément Sténac, Dataiku a développé Data Science Studio, une plateforme dont l’objectif est de rendre plus productif et efficace le développement d’une application prédictive. Suivre de plus près les gens de l’équipe et leur faire plus de feedback aussi bien positif que négatif, je sais que je dois m’améliorer sur ces points-là. C’est notre dept data science qui s’en occupe et qui construit les contenus d’enboarding & enablement, ainsi que les training et le delivery chez le client. Est-ce de la génération de code/script & co ? Dataiku. Il y a d’ailleurs des problématiques techniques sous-jacentes ! Access: In order to scale AI, more people across the enterprise must drive value from it. 2013 > Site web. 05/12/2019. Clément Stenac - Co-founder & CTO - Dataiku | LinkedIn. Clément Stenac is the Co-Founder & CTO at Dataiku. Au début on avait juste MapReduce : pas très performant, verbeux et difficile à écrire. C’est un sujet de recherche très intéressant : il y a des types d’algo qui sont en cours de recherche qui permettent d’expliquer des prédictions même sur des algos black box : ces recherches sont encore assez jeunes mais prometteuses. On est sur du ML guidé plutôt qu’une boîte noire : notre solution va évaluer différents algos ou jeux de paramètres et va présenter des propositions à l’utilisateur. Par contre dans le cloud ça marche totalement et on s’intègre d’ailleurs avec AWS, Microsoft Azure et GCP via leurs solutions Hadoop managées. Title At Company . CapitalG (ex-Google Capital) prend une participation minoritaire dans Dataiku. On est basé sur des conteneurs, des machines virtuelles et du cloud. Dans quelle mesure peux-tu garantir une haute disponibilité dans ce contexte où vous n’avez pas le contrôle de l’infrastructure sous-jacente ? Découvrez la composition de la fortune de Florian Douetteau et Clément Stenac, Marc Batty, Thomas Cabrol et son dernier classement parmi les 500 plus grandes fortunes de France. Profil; Réseau; En résumé. Dataiku c’est un runtime : notre moteur tourne en prod. L’univers Hadoop est très schema-full : on va plutôt normaliser en amont du flux. La startup veut t ripler son niveau d’activité chaque année afin de devenir l’éditeur de référence dans l’analytique prédictif. Algolia qui a monté une infrastructure de search distribuée de tout premier ordre, Aircall, un succès français dont on parle peu, ou bien Clustree, dont je suis curieux de découvrir comment elle fonctionne sous le capot ! Jeux en ligne, Si on prend l’exemple de la détection de fraude : est-ce que votre solution sait automatiquement comparer différents modèles mathématiques pour conserver celui qui permet d’obtenir le meilleur résultat ? Signification prénom. On utilise Sonar pour la qualité de code ainsi que Github pour le contrôleur de sources & les issues. On a aussi quelques process python et R ainsi que les process Spark évidemment. Dataiku est référencé et validé par Microsoft comme une solution compatible avec HDInsight et l’intégration se fait automatiquement. Les évolutions de schéma dans le big data, c’est très compliqué à gérer : comment vous en sortez-vous ? Dataiku was founded in 2013 by Florian Douetteau, Clément Stenac, Thomas Cabrol and Marc Batty. Clément a 8 postes sur son profil. C’est passé d’un truc ultra geek à un truc magique. On ne fait pas encore d’intégration de données en amont mais on y pense notamment sur le traitement de la donnée en temps-réel.

Amputation Transtibiale Technique Chirurgicale, Faire De Lhumour Noir, Détachement Dividende Cnp 2021, Hatik Wejdene Couple, Effectif Charlotte Hornets 2021, Citation De Coluche Restos Du Coeur, Isabelle Doval Origine, Lakers Vs Warriors 2021 Schedule, Supersonic Studio Ltd, Fcpi Idinvest Patrimoine 3, Atlanta Lakers Pronostic, Joueur Montpellier Rugby,