Tout va bien là-bas dans la tranchée Oracle? Bien. Big Red a une plateforme de science des données basée sur le cloud pour vous • Technologik

Une analyse Après avoir obtenu une position élevée dans applications et bases de données d’entreprise, Oracle a fixé son regard sur la science des données. Et pourtant les analystes ont exprimé des doutes quant à savoir si Big Red produit des technologies nouvelles dans le domaine, sa brillante Cloud Data Science Platform pourrait plaire à ceux qui sont déjà fortement investis dans les logiciels d’Oracle.

L’argument de Big Red est qu’il apportera de la cohésion aux efforts en science des données, permettant aux praticiens de “construire, former, gérer et déployer des modèles d’apprentissage automatique” en collaboration.

Via le service Oracle Cloud Infrastructure Data Science, les scientifiques des données pourront, selon le fournisseur, automatiser la sélection et le réglage des algorithmes, automatiser la sélection des fonctionnalités prédictives, évaluer les modèles et rendre les modèles d’apprentissage automatique explicables au monde extérieur.

Ce qui pourrait surprendre le marché, c’est la décision d’Oracle d’inclure une implémentation complète de Cloudera Hadoop dans la plateforme.

L’idée est que des équipes de scientifiques des données puissent travailler ensemble dans un environnement unique pour créer, former et gérer de nouveaux modèles d’apprentissage automatique à l’aide du langage ML populaire Python et d’autres outils et bibliothèques open source, notamment TensorFlow, Keras et Jupyter.

Selon Oracle, il intègre l’apprentissage automatique à sa base de données autonome, ce qui réduit le temps nécessaire à la préparation et au déplacement des données. Il vend également des outils “auto ML” pour faciliter la sélection et l’optimisation des modèles. Il fournit des catalogues de modèles afin que les scientifiques des données puissent mettre leurs modèles à la disposition d’autres utilisateurs, même ceux qui ne font pas partie de la science des données tels que les développeurs d’applications ou les analystes commerciaux.

Enfin, le service dispose d’outils pour aider les scientifiques des données à surveiller l’efficacité d’un modèle et à le mettre à jour à la volée pendant que les applications consommant la sortie du modèle sont toujours en cours d’exécution.

Tout cela sonne bien. Le problème est que bon nombre de ces fonctionnalités existent déjà sous une forme ou une autre auprès d’autres fournisseurs et sont sur le marché depuis un certain temps.

clones

Lorsque world + dog dispose également d’une plate-forme de données, Cloudera doit se démarquer avant que le prochain nouveau brillant ne détourne les investisseurs

LIRE LA SUITE

Depuis 2018, par exemple, Teradata a vendu gestion des modèles d’apprentissage automatique dans sa plateforme Vantage. Parallèlement, H2O.ai a lancé des outils qui automatisent de nombreux processus de développement de modèles d’apprentissage automatique dans son produit Driverless AI en 2017. Microsoft propose également Azure Machine Learning Studio, qui, selon elle, rationalise le cycle de vie du machine learning, de la création de modèles au déploiement et à la gestion. Google et AWS ont des outils similaires. Dans un marché aussi encombré, les utilisateurs peuvent se demander si l’annonce d’Oracle se démarque vraiment et si l’intégration avec la base de données la plus populaire au monde compte pour beaucoup.

Se déplacer sur le terrain

Philip Carnelley, chercheur en logiciels IDC AVP, a déclaré que la nouvelle plate-forme de science des données d’Oracle 2018 achat de datascience.com, qui a développé une plate-forme conçue pour centraliser les outils, projets et infrastructures de science des données dans un espace de travail entièrement gouverné. “Cela fait longtemps que leurs concurrents ont travaillé sur leur propre technologie. Entre-temps, Oracle a industrialisé la technologie acquise: la rendre plus robuste et l’intégrer aux autres outils Oracle.” En soi, il n’y a probablement rien que vous ne puissiez trouver ailleurs. “

Mais l’idée d’une plate-forme de science des données qui fonctionne de manière transparente avec les bases de données Oracle et la technologie d’analyse plaira aux clients décédés de Big Red. Les organisations qui ont déjà investi dans la technologie Oracle peuvent trouver de meilleures performances car elles peuvent exécuter des modèles d’apprentissage automatique directement sur la base de données, plutôt que d’extraire des données dans un autre magasin de données pour exécuter l’algorithme.

“Cela vous donne des temps de réponse très rapides et prend en charge des analyses en temps réel pour les fraudes de prédiction, par exemple. Si vous deviez les aspirer et les exécuter sur d’autres données pour les analyser sur Spark, cela pourrait être plus lent”, nous a expliqué Carnelley. En dehors de la base de clientèle principale d’Oracle, a-t-il ajouté, la décision d’utiliser sa plate-forme de science des données peut dépendre de la confiance de l’organisation dans ses compétences.

“Si vous étiez à la recherche d’un nouveau problème et que vous débattiez de l’opportunité de charger des données dans AWS S3 et d’utiliser les outils d’apprentissage automatique d’Amazon, alors cela pourrait se résumer à l’ensemble de compétences. Les outils d’Amazon seraient parfaits. Si, d’un autre côté, vos scientifiques des données sont un peu plus au niveau de l’entreprise, alors vous pourriez trouver que la technologie Oracle est plus facile à maîtriser.

“Chacune des fonctionnalités individuelles, comme les hyper-paramètres et le réglage automatique, est prise en charge par de nombreuses autres entreprises, et vous pouvez également les obtenir en open source. Mais les regrouper et les proposer pour prendre en charge la collaboration séduira certains clients.”

Ce qui pourrait déconcerter le marché, c’est la décision d’Oracle d’inclure une implémentation complète de Cloudera Hadoop dans la plateforme. Hadoop a perdu de son attrait ces dernières années, car Les difficultés de Cloudera attestent.

D’autres fournisseurs qui développent des plateformes de science et d’analyse des données basées sur le cloud, notamment AWS, Azure, Google Cloud Platform et Teradata, privilégient le stockage d’objets pour ingérer des données non structurées, à volume élevé et à vitesse élevée. La plateforme Oracle peut interroger le stockage d’objets, mais le fournisseur ne précise pas s’il ingère les données dans le stockage d’objets directement dans la nouvelle plateforme de science des données.

Oracle a déclaré que sa propre technologie de stockage d’objets s’intègre avec d’autres plates-formes, et sa documentation dit il peut être utilisé “comme référentiel de données principal pour les mégadonnées”. Alors pourquoi favoriser l’intégration complète de Hadoop?

Le partenariat d’Oracle avec Cloudera remonte à 2012. Le résultat a été un ensemble de services reposant sur des technologies conjointes, mais les utilisateurs peuvent se demander dans quelle mesure ils sont pertinents pour la prochaine génération de technologies de Big Data et d’apprentissage automatique. ®

Sponsorisé:
Exploiter la valeur des données

Source

A propos admin

Découvrez également

Cinq des meilleures applications à faire pour iOS

Les gens mènent une vie bien remplie et suivre tout ce qui doit être fait …

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *