Ce livre est destiné aux développeurs et développeuses qui souhaitent découvrir l'enrichissement de données, le big data et l'apprentissage automatique avec apache spark. après avoir donné quelques définitions du domaine de la data, l'autrice présente les fondements de spark. elle explique l'architecture logicielle du framework, les composants et les différents langages avec lesquels il est possible de développer.elle présente ensuite la transformation de données. fonctions numériques, alphanumériques, ajouts d'information, suppressions, agrégations de premier ordre et plus complexes sont à l'honneur. les lecteurs et lectrices pénétreront dans des fonctionnalités plus avancées telles que les fonctions de fenêtrage et celles définies par les utilisateurs et utilisatrices. les nombreuses api de spark sont parcourues. cet apport théorique est appuyé par des exemples de code.dans un autre temps, l'apprentissage machine est dévoilé. apprentissage supervisé, non supervisé, profond et moteurs de recommandation sont autant de paramètres étudiés. les lecteurs et lectrices découvriront les différents algorithmes présents dans l'outil, les manières de préparer des données à l'entraînement ainsi que les possibilités d'évaluation d'un système prédictif. des mises en pratique sont disponibles. les arbres de décision, forêts aléatoires, réseaux de neurones, régressions linéaires et factorisations de matrices sont enseignés.dans le domaine de la préparation de données, le traitement des informations numériques ainsi que la vectorisation de textes sont présentés.dans le dernier chapitre, c'est l'industrialisation de spark qui est mise en avant. déployer, déboguer et tester son application sont autant d'éléments cruciaux qui sont balayés. les lecteurs et lectrices apprendront les subtilités de l'outil pour une performance optimale.
Similar publications
Where to find us?
31000 Toulouse
Schedules
Le lundi de 13h30 à 19h
Du mardi au vendredi de 9h à 19h
Le samedi de 9h30 à 19h
Contact
info@librairiedeslois.com
0561225197