Rappel chaleureux - comment devenir un excellent ingénieur en apprentissage automatique

La vague d'intelligence artificielle continue de progresser. Je pense que de nombreux lecteurs se joignent à l'équipe de machine learning comme moi. Mon travail est complet: de la collecte de données, du traitement des données, de la modélisation et des services de mise en œuvre, le champ d'activité implique toutes les industries auxquelles vous pouvez penser. . Après avoir longtemps occupé ce poste, j'ai constaté que de nombreuses choses sont faites régulièrement et j'ai résumé 11 aspects auxquels un excellent ingénieur en apprentissage automatique doit prêter attention. J'espère qu'après avoir lu, les lecteurs pourront en apprendre davantage sur l'apprentissage automatique et L'apprentissage aide!

Passez du temps sur la lame: les données sont importantes!

Si vous connaissez certains principes de base de la science des données, vous constaterez que la résolution de problèmes d'application pratiques et le traitement de problèmes de codage concernent essentiellement les données. Étonnamment, j'oublie souvent cela. Souvent, je me concentre sur la construction de meilleurs modèles plutôt que sur l'amélioration de la qualité des données.

Construire un modèle plus grand et utiliser plus de ressources informatiques peut vous donner un bon résultat en peu de temps. Cependant, lorsque vous sortez et mixez, vous devez toujours rembourser, puis vous rencontrerez des choses très gênantes.

Lorsque vous participez au premier projet, veuillez consacrer beaucoup de temps à vous familiariser avec les données. La raison en est que vous devez généralement multiplier par 3 le temps que vous prévoyez de passer. À long terme, cela vous fera gagner beaucoup de temps dans le prochain travail.

Lorsque vous obtenez une nouvelle donnée, votre objectif devrait être de devenir l'expert qui connaît le mieux les données. Vous devez vérifier la distribution des données pour trouver différents types de fonctionnalités, où sont les valeurs aberrantes et pourquoi sont-elles aberrantes? Si vous ne pouvez pas décrire clairement vos données, comment pouvez-vous construire un modèle?

Ne sous-estimez pas l'importance de la communication, la communication peut apporter plus de valeur que la technologie elle-même.

La plupart des problèmes que j'ai rencontrés ne sont pas des problèmes techniques mais des problèmes de communication. En effet, les problèmes techniques existent toujours, mais c'est ce que les ingénieurs doivent résoudre. Ne sous-estimez jamais l'importance de la communication, tant à l'interne qu'à l'externe. Le pire est de résoudre un problème technique qui ne doit pas être résolu.

Pourquoi cela se produit-il?

D'un point de vue externe, la plupart des raisons pour lesquelles cela se produit sont dues à l'inadéquation entre les attentes des clients et les services que nous pouvons fournir, bien que les attentes des clients puissent être atteintes avec l'apprentissage automatique. En interne, parce que chacun de nous est responsable de nombreux aspects de l'entreprise, il nous est difficile d'atteindre le même objectif pour le même objectif.

Trois provinces

Revenons à l'essence du problème. Veuillez le faire souvent. Demandez-vous, vos clients comprennent-ils les services que vous pouvez fournir? Comprenez-vous le problème du client? Savent-ils ce que le machine learning apporte et ne peut pas apporter? Quel type de communication peut vous permettre de montrer facilement les résultats de votre travail?

Stabilité> Frontière

Bien qu'une méthode ne soit pas la plus avant-gardiste, elle peut produire suffisamment de bons résultats et cette méthode est également très facile à utiliser. Plutôt que d'améliorer une méthode à la perfection, il est préférable d'apprendre des modèles existants et d'effectuer un apprentissage par transfert sur cette base, ce qui peut apporter plus de valeur.

La loi des deux huit

Il y a une loi sur le huitième dans le domaine de l'apprentissage automatique. 20% du temps est consacré à l'apprentissage, ce qui signifie que 80% du temps sera consacré à des projets de base. Cependant, l'apprentissage est la priorité absolue.

La thèse nécessite une lecture intensive

Comment suivre la tendance de l'époque? C'est une lecture intensive de documents de haute qualité et une accumulation de précipitations. Vous ne pouvez pas suivre chaque nouvelle percée. Vous feriez mieux de maîtriser et d'appliquer certains principes de base. Ces principes de base ont résisté à l'épreuve du temps. Ensuite, il y a le besoin de nouvelles explorations et développements.

Soyez votre propre sceptique

Vous pouvez gérer l'exploration et le développement en doutant de vous-même. Le problème de l'exploration et du développement est un dilemme entre essayer de nouvelles choses et réutiliser les résultats des modèles existants.

Développez votre propre modèle

Il est facile d'exécuter le modèle que vous avez utilisé et d'obtenir des résultats de haute précision et de le signaler à l'équipe en tant que nouvelle référence. Mais si vous obtenez un bon résultat, n'oubliez pas de vérifier vos résultats encore et encore, et demandez à votre équipe de faire de même parce que vous êtes ingénieur ou scientifique.

Explorez de nouvelles choses

Le critère de 20% de temps est également utile ici, mais l'attribution de temps serait meilleure s'il est de 70/20/10. Peut-être que vous dépensez 70% sur le produit de base, 20% sur la construction du produit de base et 10% sur l'exploration, mais les choses explorées peuvent ne pas fonctionner. Je n'ai jamais essayé cette méthode moi-même, mais c'est moi Elle évolue dans ce sens.

Avancez d'abord, puis des milliers de kilomètres

N'allez pas de l'avant et construisez d'abord quelques petites choses, afin de comprendre rapidement un nouveau concept. Vous pouvez utiliser votre propre ensemble de données ou de petites données non liées. Dans une petite équipe, l'astuce pour réussir est de réussir d'abord. Étape puis itérer rapidement.

Changer constamment

请记住，我的目标不是发明一种新的机器学习算法，而是向客户展示机器学习对他们的业务是否有帮助,有了坚固的基础，你就可以建立你自己的最好模型，而不是重复使用已有的模型了。软件行业的快速迭代，你去年所做的工作明年可能就没用了哦！这是客观事实，由于软件工程和机器学习工程的融合，这种情况越来越严重。但是你既然已经加入了机器学习的大家庭，我来告诉你什么保持不变——框架会变化，库会变化，但基础统计，概率论，数学永远不会变。最大的挑战仍然是：如何应用它们。

Rappel chaleureux - comment devenir un excellent ingénieur en apprentissage automatique

Je suppose que tu aimes