<?xml version="1.0" encoding="UTF-8"?><metadata>
<lom xmlns="http://ltsc.ieee.org/xsd/LOM" xmlns:lomfr="http://www.lom-fr.fr/xsd/LOMFR" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://ltsc.ieee.org/xsd/LOM http://www.lom-fr.fr/xsd/lomfrv1.0/std/lomfr.xsd">
<general>
    <identifier>
        <catalog>Canal-U_Ocms</catalog>
        <entry>24662</entry>
    </identifier>
    <title><string language="fre"><![CDATA[5.4. L’algorithme UPGMA]]></string></title>
    <language>FRE</language>
    <description>
        <string language="fre"><![CDATA[L'algorithme, que nous allons étudier pour la reconstruction d'arbres phylogénétiques à partir des distances, s'appelle UPGMA. Un nom plutôt compliqué pour une méthode qui est plutôt simple. Et même, on le verra trop simple. UPGMA signifie Unweighted Pair Group Method with Arithmetic Mean. Nous allons voir au fur et à mesure, la signification dans l'exécution de l'algorithme de chacun de ces termes. Le point de départ de cet algorithme est donc un tableau de distances, tel que nous avons pu le remplir dans la session précédente. Voilà l'exemple que nous allons traiter. C'est un exemple simple. Nous avons sept espèces différentes et nous avons calculé les distances entre ces espèces à travers le calcul des distances, entre les séquences d'un gène homologue de ces espèces, à toutes ces espèces. Vous vous souvenez que le tableau que nous avons calculé était d'une part symétrique et que d'autre part, les valeurs sur la diagonale étaient sans surprise égales à 0. Ici nous avons choisi de ne conserver et de n'afficher que les valeurs significatives. Donc inutile de montrer les valeurs qui sont les symétriques des autres. Et inutile d'afficher les 0 sur les diagonales. Ce qui explique que notre tableau apparaît incomplet d'une certaine manière. La première étape de l'algorithme consiste à rechercher parmi toutes ces valeurs de distance dans le tableau la plus petite. Ici, c'est 2 et c'est la distance qui sépare l'espèce F de l'espèce C. Raccourci de langage, la distance qui sépare les séquences associées aux espèces F et C. C'est la distance la plus faible. Elle nous pousse donc à grouper ces 2 espèces dans un même sous-graphe en créant un noeud ancêtre ici. Ces 2 espèces sont proches, sont similaires parce qu'elles possèdent un ancêtre commun récent...


ERRATUM



 Sur la slide 3 l’orateur parle de 7 espèces différentes, en fait il y 
en a  6.]]></string></description>
    <keyword><string language="fre"><![CDATA[génomique]]></string></keyword><keyword><string language="fre"><![CDATA[algorithmique]]></string></keyword><keyword><string language="fre"><![CDATA[bioinformatique]]></string></keyword><keyword><string language="fre"><![CDATA[biologie cellulaire et moléculaire]]></string></keyword><keyword><string language="fre"><![CDATA[modélisation]]></string></keyword><keyword><string language="fre"><![CDATA[arbre phylogénétique]]></string></keyword>
    <lomfr:documentType>
        <lomfr:source>LOMFRv1.0</lomfr:source>
        <lomfr:value>image en mouvement</lomfr:value>
    </lomfr:documentType>
</general><lifeCycle>
    
    <contribute>
            <role>
                <source>LOMv1.0</source>
                <value>author</value>
            </role>
            <entity><![CDATA[BEGIN:VCARD
VERSION:3.0
CLASS:PUBLIC
REV:2016-10-30 00:01:37
FN:Francois RECHENMANN
N:RECHENMANN;Francois;;;

URL;TYPE=work:http://www.canal-u.tv/auteurs/rechenmann_francois
ROLE:author
NOTE:  Ingénieur et Docteur-Ingénieur en informatique, François Rechenmann est chercheur au centre Inria Grenoble – Rhône-Alpes. Il y exerce ses activités à l’interface de l’informatique et des sciences du vivant en contribuant plus particulièrement au développement de méthodes et de logiciels pour l’analyse des séquences génomiques des microorganismes. Cofondateur de la société Genostar, qui propose des solutions bioinformatiques aux industries pharmaceutiques, agroalimentaires et biotechnologiques, il en est le conseiller scientifique. Très impliqué dans les actions de médiation scientifique, François Rechenmann est le responsable scientifique du site Interstices dont l’objectif est d’expliquer l’informatique en tant que domaine de recherche.   
TZ:+0200
END:VCARD
]]></entity>
            <date><dateTime>2015-06-01</dateTime></date>
        </contribute>

    <contribute>
            <role>
                <source>LOMv1.0</source>
                <value>author</value>
            </role>
            <entity><![CDATA[BEGIN:VCARD
VERSION:3.0
CLASS:PUBLIC
REV:2016-10-30 00:01:37
FN:Thierry PARMENTELAT
N:PARMENTELAT;Thierry;;;

URL;TYPE=work:http://www.canal-u.tv/auteurs/parmentelat_thierry
ROLE:author
NOTE:Thierry Parmentelat a mené une carrière hybride entre les mondes   académique et industriel. Ses centres d'intérêt couvrent les langages de   programmation, les réseaux, et l'algèbre. Actuellement ingénieur de   recherche chez Inria, Thierry Parmentelat utilise Python depuis plus de   10 ans pour ses travaux de recherche, ainsi que pour le développement   des plateformes expérimentales dont il a la charge. 
TZ:+0200
END:VCARD
]]></entity>
            <date><dateTime>2015-06-01</dateTime></date>
        </contribute>

</lifeCycle>
<metaMetadata>
    <metadataSchema>LOMv1.0</metadataSchema>
    <metadataSchema>LOMFRv1.0</metadataSchema>
</metaMetadata>
<technical>
    <format>video/x-flv</format>
    <location><![CDATA[http://www.canal-u.tv/video/inria/5_4_l_algorithme_upgma.24662]]></location>
    <location><![CDATA[rtmpt://fms2.cerimes.fr:80/vod/fuscia/changer.l.echelle.du.chemin.copie._24662/c016fr.w5.s4.fr.mp4]]></location>
        <location><![CDATA[http://www.canal-u.tv/video/inria/dl.1/5_4_l_algorithme_upgma.24662]]></location>
        
    <size>202756303</size>
    <duration><duration>PT0H5M16S</duration></duration>
</technical>
<educational>
    <learningResourceType>
        <source>LOMv1.0</source>
        <value>lecture</value>
    </learningResourceType>
    
    <context>
        <source>LOMv1.0</source>
        <value>higher education</value>
    </context>
    <context>
        <source>LOMv1.0</source>
        <value>licence</value>
    </context>
    <context>
        <source>LOMv1.0</source>
        <value>licence</value>
    </context>
</educational>
<rights>
    <cost>
        <source>LOMv1.0</source>
        <value>no</value>
    </cost>
    <copyrightAndOtherRestrictions>
        <source>LOMv1.0</source>
        <value>no</value>
    </copyrightAndOtherRestrictions>
    <description>
        <string language="fre"><![CDATA[Droits réservés à l'éditeur et aux auteurs. 
Ces ressources de cours sont, sauf mention contraire, diffusées sous Licence Creative Commons. L’utilisateur doit mentionner le nom de l’auteur, il peut exploiter l’œuvre sauf dans un contexte commercial et il ne peut apporter de modifications à l’œuvre originale.]]></string>
    </description>
</rights>

            <relation>
                <kind>
                    <source>LOMv1.0</source>
                    <value>ispartof</value>
                </kind>
                <resource>
                    <identifier>
                        <catalog>URI</catalog>
                        <entry>http://www.canal-u.tv/producteurs/inria/cours_en_ligne/bioinformatique_algorithmes_et_genomes/arbres_phylogenetiques</entry>
                    </identifier>
                    <description>
                        <string language="fre"><![CDATA[5. Arbres phylogénétiques]]></string>
                    </description>
                </resource>
            </relation>

<classification>
    <purpose>
        <source>LOMv1.0</source>
        <value>discipline</value>
    </purpose>
    <taxonPath>
        <source>
        <string language="fre"><![CDATA[Universités Numériques Thématiques 2009 http://www.universites-numeriques.fr]]></string>
        </source>
        <taxon>
            <id/>
            <entry>
                <string language="fre"/>
            </entry>
        </taxon>
    </taxonPath>
</classification>
<classification>
    <purpose>
        <source>LOMv1.0</source>
        <value>discipline</value>
    </purpose>
    
    <taxonPath>
        <source>
            <string language="fre">CDD 22e éd.</string>
            <string language="eng">DDC 22nd ed.</string>
        </source>
        <taxon>
            <id>570.285</id>
            <entry>
                <string language="fre"><![CDATA[biologie application informatique]]></string>
            </entry>
        </taxon>
   </taxonPath>
</classification>      </lom>
   </metadata>