Choisir une solution de datamining en PME : l’audit logiciel

Quand on cherche à mettre en oeuvre un projet de datamining au sein d’une PME, la question de l’outil logiciel adéquat de pose de manière d’autant plus aiguë qu’au-delà des objectifs recherchés et des fonctionnalités souhaitées, le budget disponible est souvent très serré.

En toute logique, l’on vise alors le meilleur compromis possible entre l’utilité réelle de la solution de datamining pour l’entreprise et l’effort financier que l’on peut consentir au vu du retour sur investissement attendu.

Utiliser le web pour dresser un inventaire des solutions disponibles - que celles-ci soient explicitement commerciales ou (plus rarement) issues de l’univers des logiciels libres - constitue une tâche préalable assez aisée, tant l’internet regorge de sites dédiés à ce sujet. Une fois cette liste établie, vient naturellement la phase concrète des tests d’utilisation…

La solution logicielle idéale permet, avec facilité et rapidité, d’extraire les données d’origine pour construire un corpus de données d’analyse, d’auditer la qualité des données extraites, de “nettoyer” le jeu de données en offrant une palette d’outils statistiques paramétrables, de tester plusieurs algorithmes de modélisation en comparant leurs performances, et, en dernier ressort, de générer un code informatique réutilisable - c’est-à-dire un code qui, une fois décortiqué, se révèle propice à une réécriture dans le langage priviligié par le système d’information en vigueur dans l’entreprise.

Or, par opposition aux jeux de données de démonstration (souvent fournis dans les version d’évaluation, quand elles existent) ou aux jeux de données à finalité académique (quelques-uns sont gracieusement disponibles sur internet), la confrontation avec des jeux de données réels donne l’occasion de pousser les logiciels vers certains de leurs “derniers retranchements”, affinant ainsi la présélection initiale…

J’ai souvent été (désagréablement) surpris de constater que les solutions commerciales parmi les plus célèbres n’offraient pas (et même interdisaient !) - une fois le flux datamining construit et le modèle prédictif validé - la possibilité d’exporter tout simplement un code SQL réexploitable, après quelques ajustements, dans une procédure automatisée de scoring de base de données clients…

…si cette pratique des éditeurs peut commercialement se justifier auprès de clients grands comptes disposés à acheter des serveurs dédiés et les licences associées pour des budgets atteignant très vite plusieurs dizaines de milliers d’euros (voire au-delà), elle devient contre-productive lorsque ces mêmes éditeurs prétendent proposer des versions adaptées aux PME, fussent-elles monoposte et limitées à quelques algorithmes-phares utilisés en marketing (comme les arbres de décision par exemple).

Ce choix commercial de “bridage logiciel” devient même un obstacle à la propagation du datamining dans la majorité des entreprises françaises - lesquelles sont presque toutes des PME !… Il reste alors à se tourner vers des solutions (fréquemment innovantes) éditées par… d’autres PME.

Si au sein de votre PME vous vous posez la question de savoir quelle solution de datamining choisir, prenez vos précautions en conduisant - avec Autour du Client ;-) - un audit des logiciels concurrents, en utilisant un jeu de données issu de votre entreprise : vous prendrez une décision d’investissement forcément plus éclairée, et vous adopterez une solution évolutive justement calibrée.

Publier un commentaire

Vous devez vous identifier pour publier un commentaire.

Autour du Client

Tous droits réservés © Autour du Client 2007              Autour du Client : Le Blog est propulsé par WordPress

Valid XHTML 1.0 Transitional