Dans le monde de la modélisation analytique, il existe plusieurs solutions qui utilisent différentes méthodologies de modélisation des coûts. Pour comprendre le fonctionnement d’easyKost, il est important de comprendre les choix de haut niveau qu’une solution peut adopter pour modéliser les coûts, et leurs avantages.

Commençons par introduire easyKost. C’est un logiciel de chiffrage, de Data minning, d’estimation et d’optimisation de coûts qui permet de déterminer, en quelques secondes, le coût de nouveaux produits ou services, en exploitant la richesse de vos données et cela sans connaissance approfondie des technologies et processus industriels. Développé sur une architecture Saas, il utilise un algorithme de machine learning non linéaire principalement basé sur les Forêts Aléatoires dans l’estimation des coûts.

Il existe 4 grandes méthodologies de modélisation des coûts :

  • Bases de connaissances / Interprétation basée sur des cas :Dans cette approche top-down, l’utilisateur s’appuie sur une base de données de services ou produits antérieurs qui ont des attributs similaires à celui dont le coût est évalué. L’utilisateur spécifie les attributs du nouveau coût du produit et du service. L’algorithme de raisonnement basé sur des cas interpole entre les objets similaires passés dans la base de données pour fournir une estimation des coûts pour le nouvel objet
  • Approche Mécaniste « bottom-up » des coûts :Le prix de la pièce ou du service est basé sur la quantité physique de chaque matériau, le contenu de la main-d’œuvre et de du temps machine, l’utilisation de l’outillage, etc. Ces éléments de coûts sont basés sur leur valeur actuelle, sans égard à tout prix ou coût passé. Ces modèles nécessitent de comprendre la relation réelle qui génère l’utilisation des ressources physiques, telles que le temps, l’outillage, le poids, etc. Bien que les modèles puissent calculer directement le coût, les valeurs intermédiaires (temps, outillage, masse) sont le plus souvent calculées, puis ces quantités sont converties en coût grâce à une série de taux financiers (par exemple: coût par kilogramme pour le matériau, coût par heure pour un employé ou machine, etc.)
  • Modélisation des coûts par indexation:Il s’agit d’une méthodologie Top-Down dans laquelle l’utilisateur définit un devis ou un prix pour le produit ou le service dans le passé. Ensuite, l’utilisateur décompose ce coût en ses composants constitutifs, tels qu’une nomenclature, et lie chaque matière première à un indice de produit. Cela pourrait également inclure les coûts des services, tels que la main-d’œuvre, qui pourraient être des indices liés tels que l’IPC ou le taux de main-d’œuvre moyen. Le panier d’indices liés indique à l’utilisateur comment le coût est modifié pour chacune de ses  composantes entre le coût de référence (coût initial dans le passé) et le coût au jour en cours
  • Méthodes de modélisation statistique : Dans cette méthode Top-Down, une population de données passées est analysée. Le modeleur fournit une matrice de variables indépendantes (inducteurs de coût) pour chaque produit ou service, ainsi que des variables de sortie d’intérêt. Cela peut être n’importe quelle variable de sortie, y compris le coût. Le système construira une relation empirique entre les variables indépendantes et la variable dépendante. Ensuite, il est simple d’introduire un nouvel ensemble d’inducteurs de coûts qui représentent un nouveau produit ou service client et de calculer le coût estimé du nouveau produit ou service correspondant.

Chez easyKost, nous utilisons cette dernière méthodologie pour l’estimation des coûts des produits et/ou des services : les méthodes empiriques stochastiques ou statistiques. La majorité des entreprises familières avec les méthodes statistiques, connaissent ‘’l’ajustement de courbe’’, ce qui est généralement un argot pour la régression linéaire multivariée des moindres carrés. Cependant, il existe de nombreux algorithmes statistiques différents pour modéliser des populations de données d’entrée dans un espace à n dimensions. Nous nous appuyons sur un algorithme très flexible appelé ‘’Random Forest’’ ou ‘’Forêts Aléatoires’’. Il s’agit d’un algorithme non linéaire, permettant de mieux adapter vos données.

Le fonctionnement de l’algorithme est le suivant :

  • Introduire la base de données historiques d’apprentissage (matrice des Cost-Drivers pour la population de pièces ou de services) et le vecteur de variable de sortie (par exemple : coût, temps de cycle…)
  • L’algorithme de forêt aléatoire analysera les données en créant des milliers d’arbres de décision, pour modéliser le coût en supprimant aléatoirement une partie des données et en observant l’erreur par rapport au résultat historique pour chacun de ces arbres
  • Ces arbres sont agrégés pour minimiser une variable d’erreur

Les avantages de l’algorithme des forêts aléatoires sont nombreux:

  • Cet algorithme nous permet d’une augmentation de plus de 50% de la précision par rapport à la régression linéaire multivariée ou d’autres méthodes statistiques
  • Comparée à d’autres techniques d’IA telles que la logique floue et l’apprentissage automatique, la forêt aléatoire est beaucoup plus efficace (calcule plus rapidement)
  • Les valeurs aberrantes sont bien gérées par cet algorithme puisqu’il est de nature non-linéaire
  • La covariance des variables d’entrée est prise en charge par l’algorithme, alors que c’est toujours un défi lors de l’utilisation de la régression linéaire multivariée standard
  • La forêt aléatoire peut gérer les données valeurs manquantes dans la base de données source, en les remplaçant par les valeurs statistiquement les plus probables