{"id":965,"date":"2022-01-21T20:46:37","date_gmt":"2022-01-21T19:46:37","guid":{"rendered":"https:\/\/mastermas.univ-lyon1.fr\/?page_id=965"},"modified":"2022-01-21T20:46:38","modified_gmt":"2022-01-21T19:46:38","slug":"methodes-mathematiques-pour-le-text-mining","status":"publish","type":"page","link":"https:\/\/mastermas.univ-lyon1.fr\/index.php\/methodes-mathematiques-pour-le-text-mining\/","title":{"rendered":"METHODES MATHEMATIQUES POUR LE TEXT MINING"},"content":{"rendered":"\n<p>Analyse automatique de textes (text mining):<\/p>\n\n\n\n<p>r\u00e9ponses ouvertes \u00e0 des questionnaires, entretiens, litt\u00e9rature scientifique, r\u00e9seaux sociaux par extraction des correspondances de Galois (treillis des itemsets fr\u00e9quents) et allocation latente de Dirichlet (LDA),<\/p>\n\n\n\n<p>Nous utilisons une repr\u00e9sentation en sac de mots focalis\u00e9e sur l\u2019\u00e9tude des co-occurrences et les fr\u00e9quences des termes. Cette approche est adapt\u00e9e \u00e0 l\u2019\u00e9tude des textes courts tels que les r\u00e9ponses ouvertes \u00e0 un questionnaire ou les commentaires sur les r\u00e9seaux sociaux qui ne comportent qu\u2019un nombre r\u00e9duit d\u2019affirmations. Ces hypoth\u00e8ses nous permettent d\u2019appliquer le concept d\u2019\u00e9changeabilit\u00e9 mis en exergue par De Finetti (https:\/\/journals.openedition.org\/msh\/6793) ce qui permet de supposer l\u2019existence d\u2019une variable latente multinomiale explicative des d\u00e9pendances entre termes.<\/p>\n\n\n\n<p>L\u2019ensemble des associations caract\u00e9ristiques d\u2019un concept constitue un treillis de correspondance de Galois. Celui-ci admet une base g\u00e9n\u00e9rative canonique calculable en temps polynomial mais instable vis-\u00e0-vis des seuils de fr\u00e9quences utilis\u00e9s (<a>https:\/\/journals.openedition.org\/msh\/6793<\/a>). Les mod\u00e8les de Dirichlet permettent d\u2019en extraire des r\u00e9sum\u00e9s plus stables, mais ne peuvent pas \u00eatre calcul\u00e9s de mani\u00e8re exacte. Il est n\u00e9cessaire en particulier d\u2019estimer le nombre de modalit\u00e9s de la variable multinomiale latente (https:\/\/www.cairn.info\/revue-document-numerique-2014-1-page-61.htm).<\/p>\n\n\n\n<p>Le d\u00e9roulement de cet enseignement en 10 s\u00e9ances de 3h:<\/p>\n\n\n\n<ol class=\"wp-block-list\" type=\"1\"><li>Mod\u00e8les de repr\u00e9sentation du texte pour son analyse automatique.<\/li><li>Mise en \u0153uvre avec Keras et TensorFlow dans un environnement Rstudio<\/li><li>Introduction aux treillis de Galois<\/li><li>Application \u00e0 l\u2019analyse formelle de concepts<\/li><li>Th\u00e9or\u00e8me d\u2019existence d\u2019une base canonique d\u2019implications<\/li><li>Application avec la biblioth\u00e8que R arules<\/li><li>Introduction \u00e0 l\u2019analyse implicative Bay\u00e9sienne multivari\u00e9e<\/li><li>Concept d\u2019\u00e9changeabilit\u00e9 de De Finetti<\/li><li>Mise en \u0153uvre de l\u2019allocation latente de Dirichlet (LDA) avec les biblioth\u00e8ques R topicsmodels et ldatuning<\/li><li>Approximation du LDA par inf\u00e9rence variationnelle stochastique avec TensorFlow.<\/li><\/ol>\n\n\n\n<p>L\u2019ensemble des travaux pratiques se d\u00e9rouleront sur serveur d\u00e9di\u00e9 au Deep Learning dans un environnement Rstudio (https:\/\/tensorflow.rstudio.com\/)<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Analyse automatique de textes (text mining): r\u00e9ponses ouvertes \u00e0 des questionnaires, entretiens, litt\u00e9rature scientifique, r\u00e9seaux sociaux par extraction des correspondances de Galois (treillis des itemsets fr\u00e9quents) et allocation latente de Dirichlet (LDA), Nous utilisons une repr\u00e9sentation en sac de mots focalis\u00e9e sur l\u2019\u00e9tude des co-occurrences et les fr\u00e9quences des termes. Cette approche est adapt\u00e9e \u00e0 <a class=\"more-link\" href=\"https:\/\/mastermas.univ-lyon1.fr\/index.php\/methodes-mathematiques-pour-le-text-mining\/\">Lire plus &#8230;<\/a><\/p>\n","protected":false},"author":6,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-965","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/mastermas.univ-lyon1.fr\/index.php\/wp-json\/wp\/v2\/pages\/965","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/mastermas.univ-lyon1.fr\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/mastermas.univ-lyon1.fr\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/mastermas.univ-lyon1.fr\/index.php\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/mastermas.univ-lyon1.fr\/index.php\/wp-json\/wp\/v2\/comments?post=965"}],"version-history":[{"count":1,"href":"https:\/\/mastermas.univ-lyon1.fr\/index.php\/wp-json\/wp\/v2\/pages\/965\/revisions"}],"predecessor-version":[{"id":966,"href":"https:\/\/mastermas.univ-lyon1.fr\/index.php\/wp-json\/wp\/v2\/pages\/965\/revisions\/966"}],"wp:attachment":[{"href":"https:\/\/mastermas.univ-lyon1.fr\/index.php\/wp-json\/wp\/v2\/media?parent=965"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}