Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
MUTANT STRAINS OF TRICHODERMA REESEI
Document Type and Number:
WIPO Patent Application WO/2015/140455
Kind Code:
A1
Abstract:
The invention relates to mutant strains of Trichoderma reesei, characterized by an improvement in the enzyme production thereof relative to the non-modified Trichoderma reesei strain.

Inventors:
POGGI PARODI DANTE (FR)
BIDARD-MICHELOT FRÉDÉRIQUE (FR)
MARGEOT ANTOINE (FR)
PORTNOY THOMAS (FR)
LE CROM STÉPHANE (FR)
Application Number:
PCT/FR2015/050629
Publication Date:
September 24, 2015
Filing Date:
March 16, 2015
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
IFP ENERGIES NOUVELLES (FR)
International Classes:
C12N15/90; C12N1/14; C12P7/10; C12R1/885
Domestic Patent References:
WO2000046375A22000-08-10
WO2009098365A22009-08-13
Foreign References:
CN103060341A2013-04-24
Other References:
ARO N ET AL: "Transcript regulation of plant cell wall degradation by filamentous fungi", FEMS MICROBIOLOGY REVIEWS, ELSEVIER, AMSTERDAM; NL, vol. 29, no. 4, 2005, pages 719 - 739, XP008114070, ISSN: 0168-6445, [retrieved on 20041222], DOI: 10.1016/J.FEMSRE.2004.11.006
M. A. PENALVA ET AL: "Regulation of Gene Expression by Ambient pH in Filamentous Fungi and Yeasts", MICROBIOLOGY AND MOLECULAR BIOLOGY REVIEWS, vol. 66, no. 3, September 2002 (2002-09-01), pages 426 - 446, XP055150781, ISSN: 1092-2172, DOI: 10.1128/MMBR.66.3.426-446.2002
NAOMI TRUSHINA ET AL: "PacC and pH-dependent transcriptome of the mycotrophic fungus Trichoderma vi", BMC GENOMICS, BIOMED CENTRAL LTD, LONDON, UK, vol. 14, no. 1, 28 February 2013 (2013-02-28), pages 138, XP021146386, ISSN: 1471-2164, DOI: 10.1186/1471-2164-14-138
ELIECER DÍEZ ET AL: "Activation of the Aspergillus PacC zinc finger transcription factor requires two proteolytic steps", THE EMBO JOURNAL, vol. 21, no. 6, 15 March 2002 (2002-03-15), pages 1350 - 1359, XP055150796, ISSN: 0261-4189, DOI: 10.1093/emboj/21.6.1350
SAMOLSKI ILANIT ET AL: "Gene expression analysis of the biocontrol fungus Trichoderma harzianum in the presence of tomato plants, chitin, or glucose using a high-density oligonucleotide microarray", BMC MICROBIOLOGY, BIOMED CENTRAL LTD, GB, vol. 9, no. 1, 13 October 2009 (2009-10-13), pages 217, XP021062321, ISSN: 1471-2180, DOI: 10.1186/1471-2180-9-217
LILIAN DOS SANTOS CASTRO ET AL: "Comparative metabolism of cellulose, sophorose and glucose in Trichoderma reesei using high-throughput genomic and proteomic analyses", BIOTECHNOLOGY FOR BIOFUELS, BIOMED CENTRAL LTD, GB, vol. 7, no. 1, 21 March 2014 (2014-03-21), pages 41, XP021181143, ISSN: 1754-6834, DOI: 10.1186/1754-6834-7-41
HE RONGLIN ET AL: "Trpac1, a pH response transcription regulator, is involved in cellulase gene expression inTrichoderma reesei", ENZYME AND MICROBIAL TECHNOLOGY, STONEHAM, MA, US, vol. 67, 6 September 2014 (2014-09-06), pages 17 - 26, XP029084273, ISSN: 0141-0229, DOI: 10.1016/J.ENZMICTEC.2014.08.013
DIEZ ET AL.: "Activation of the Aspergillus PacC zinc finger transcription factor requires two proteolytic steps", THE EMBO JOURNAL, vol. 21, no. 6, 2002, pages 1350 - 1359
MAEDA ET AL.: "The signaling mechanism of ambient pH sensing and adaptation in yeast andfungi", FEBS JOURNAL, 2012, pages 279
SCHUSTER, A.; BRUNO, K. S.; COLLETT, J. R.; BAKER, S. E.; SEIBOTH, B.; KUBICEK, C. P.; SCHMOLL, M.: "A versatile toolkit for high throughput functional genomics with Trichoderma reesei", BIOTECHNOLOGY FOR BIOFUELS, vol. 5, no. 1, 2012, pages 1
DURAND, H.; CLANET, M.; TIRABY, G.: "Genetic Improvement of Trichoderma reesei for large scale cellulase production", ENZYME AND MICROBIAL TECHNOLOGY, vol. 10, 1988, pages 341 - 346
PENTTILA, M.; NEVALAINEN, H.; RATTO, M.; SALMINEN, E.; KNOWLES, J.: "A versatile transformation system for the cellulolytic filamentous fungus Trichoderma reesei", GENE, vol. 61, 1987, pages 155 - 164
DURAND, H.; M. CLANET; G. TIRABY: "Genetic improvement of Trichoderma reesei for large scale cellulase production", ENZYME MICROB. TECHNOL., vol. 10, 1988, pages 341 - 346
GUANGTAO, Z.; HARTL, L.; SCHUSTER, A.; POLAK, S.; SCHMOLL, M.; WANG, T.; SEIDL, V. ET AL.: "Gene targeting in a nonhomologous end joining deficient Hypocrea jecorina", JOURNAL OF BIOTECHNOLOGY, vol. 139, no. 2, 2009, pages 146 - 51
Attorney, Agent or Firm:
CABINET PLASSERAUD (FR)
Download PDF:
Claims:
REVENDICATIONS

1. Souche de Trichoderma reesei dont le génome comprend une mutation choisie parmi:

une délétion du gène codant pour PacC;

une mutation entre les positions 1 à 735 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 249 à 495;

une mutation entre les positions 736 à 744 de la séquence nucléotidique représentée en SEQ ID N° 1 ; et

une mutation entre les positions 1438 à 1515 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 1492 à 1494. 2. Souche selon la revendication 1, caractérisée en ce qu'elle présente une capacité de production d'enzymes améliorée par rapport à la même souche T. reesei non modifiée ou par rapport à une souche de référence de T. reesei.

3. Souche selon la revendication 1 ou 2, caractérisé en ce que lesdites enzymes sont choisies parmi les enzymes cellulolytiques, préférentiellement les cellulases et les hémicellulases, encore plus préférentiellement les cellulases.

4. Souche selon l'une des revendications 1 à 3, caractérisée en ce que ladite mutation est induite par mutagénèse dirigée, préférentiellement à l'aide d'une cassette de délétion.

5. Utilisation d'une souche modifiée selon l'une quelconque des revendications 1 à 4 pour la production d'enzymes cellulolytiques.

6. Utilisation d'une souche selon l'une quelconque des revendications 1 à 4 pour l'hydrolyse des beta-oligosaccharides.

7. Utilisation d'une souche selon l'une quelconque des revendications 1 à 4 pour l'hydrolyse du cellobiose en glucose.

Description:
Souches mutantes de Trichoderma reesei

La possibilité de produire de l'éthanol à partir de la cellulose a reçu beaucoup d'attention en raison de la disponibilité de grandes quantités de matière première ainsi que de l'intérêt de l'éthanol à titre de carburant. Les matières premières naturelles cellulosiques pour un tel processus sont désignées par le terme "biomasse". De nombreux types de biomasse, par exemple le bois, les résidus agricoles, les cultures herbacées et les déchets solides municipaux, ont été considérés comme des matières premières potentielles pour la production de biocarburant. Ces matières sont constituées principalement de cellulose, d'hémicellulose et de lignine.

La cellulose est un polymère constitué de molécules de glucose reliées par des liaisons beta 1-4, qui sont très résistantes à la dégradation ou à la dépolymérisation. Une fois la cellulose convertie en glucose, celui-ci est facilement fermenté en biocarburant, par exemple l'éthanol, en utilisant une levure.

Les plus anciennes méthodes étudiées pour convertir la cellulose en glucose sont basées sur l'hydrolyse acide. Ce processus peut se faire en présence d'acides concentrés ou dilués. Cependant, plusieurs inconvénients tels que la mauvaise récupération de l'acide lors de l'utilisation d'acides concentrés et la faible production de glucose dans le cadre de l'utilisation d'acides dilués nuisent à l'économie du processus d'hydrolyse acide.

Pour surmonter les inconvénients du processus d'hydrolyse acide, les processus de conversion de la cellulose ont porté plus récemment sur l'hydrolyse enzymatique, à l'aide d'enzymes de type cellulase. Cette hydrolyse enzymatique de la biomasse lignocellulosique (par exemple, la cellulose) présente cependant l'inconvénient d'être un procédé industriel coûteux. De ce fait, il est nécessaire d'utiliser des souches de microorganismes sécréteurs de cellulases de plus en plus performantes. A ce titre, beaucoup de microorganismes comportent des enzymes qui hydrolysent la cellulose, tels que les champignons Trichoderma, Aspergillus, Humicola, Fusarium ainsi que les bactéries telles que Thermomonospora, Bacillus, Cellulomonas et Streptomyces.

Pour diminuer le coût associé à l'hydrolyse enzymatique de la lignocellulose, l'industrie est à la recherche constante de souches plus productives ou présentant un meilleur rendement.

Il existe donc un besoin d'optimisation de la production d'enzymes dans le processus industriel. Ainsi, pris dans son ensemble, l'art antérieur fait apparaître un besoin inassouvi et longtemps attendu de développer des souches aux performances de productions d'enzymes améliorées. C'est le problème que se propose de résoudre la présente invention.

A l'issue de long et fastidieux travaux sur le transcriptome de Trichoderma reesei les inventeurs ont montré que 592 gènes au total étaient induits ou réprimés au cours de la procédé de production d'enzymes dans une souche de ce champignon. Parmi ces 592 gènes, les inventeurs ont mis en évidence le rôle d'un d'entre eux, précisément PacC, dans la régulation de la production d'enzymes. Les inventeurs ont ainsi développé une souche mutante de Trichoderma reesei caractérisée par une amélioration significative de la production d'enzymes, en particulier des enzymes cellulolytiques.

Aussi, l'invention concerne une souche de Trichoderma reesei dont le génome comprend une mutation choisie parmi:

une délétion du gène codant pour PacC;

une mutation entre les positions 1 à 735 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 249 à 495;

- une mutation entre les positions 736 à 744 de la séquence nucléotidique représentée en SEQ ID N° 1 ; et

une mutation entre les positions 1438 à 1515 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 1492 à 1494. Cette souche mutée est caractérisée par une amélioration de la production d'enzymes cellulolytiques par rapport à la même souche de T. reesei non modifiée, ou par rapport à une souche de référence de T. reesei.

Trichoderma reesei est un champignon filamenteux cellulolytique. Compte tenu de la capacité de T. reesei à sécréter de grandes quantités de cellulases et des hémicellulases, cette souche est hautement intéressante pour la production d'enzymes pour la transformation des matières de la biomasse végétale en bioproduits utiles à l'industrie, tels que le bioéthanol.

Par "souche de référence de T. reesei" , on entend une souche de Trichoderma reesei choisie parmi les souches QM6a, NG14, RUTC30 et QM9414. Ces souches sont accessibles au public et ont notamment fait l'objet de dépôts, respectivement sous les numéros:

- ATCC 13631 (souche QM6a);

- ATCC 56767 (souche NG14);

- ATCC 56765 (souche RUT C30); et

- ATCC 26921 (souche QM9414).

Dans un mode de réalisation particulier, la souche est la souche CL847. Cette souche est une souche hyperproductive.

Typiquement, cette souche de référence ne présente aucune mutation sur le gène de PacC.

Dans le cadre de la présente invention, les termes "PacC" et "RIM101" font référence à un facteur de transcription dont la séquence protéique native est représentée en SEQ ID N°2. Cette séquence est disponible en ligne sous les numéros d'accession GenBank: EGR50864.1 (souche T.reesei QM6a) ou encore GenBank: ETS05643.1 (souche T.reesei RUT C-30) et sur le site dédié au génome de T. reesei, sous le numéro TR120698 à l'adresse suivante (http://genome. gi-psf. ors/cgi-bin/dispGeneModel ?db= rirel &xd- 120698). A moins que cela ne soit indiqué autrement, les termes PacC et RIMIOI font référence à la protéine telle que retrouvée dans la souche Trichoderma reesei.

Le facteur PacC comprend un motif en doigt de zinc Cys2-His2. Les protéines présentant un motif en doit de zinc sont caractérisées par leur capacité à se replier autour d'un ion Zn2+, produisant ainsi un domaine compact. Le motif en doigt de zinc Cys2-His2 est le motif le plus courant de liaison à l'ADN. Il présente une séquence consensus de 23 à 26 résidus avec deux résidus cystéine et deux résidus histidine conservés, dont les chaînes latérales fixent un ion Zn2+. Il s'ensuit que la séquence consensus d'un doigt de zinc est comme suit:

Cys-X2-4-Cys-X-Phe-X5-Leu-X2-His-X3-His.

PacC a fait l'objet de plusieurs publications scientifiques du fait de son rôle en tant que senseur de pH, c'est-à-dire en tant que facteur dont l'expression est modulée en fonction du pH ambiant de la cellule. L'activité de PacC est régulée par traitement protéolytique, comme décrit notamment dans la publication Diez et al., "Activation of the Aspergillus PacC zinc finger transcription factor requires two proteolytic steps", The EMBO Journal, Vol 21, No 6, ppl350-1359, 2002. En effet, sous conditions acides, la forme non clivée de PacC prédomine. Cependant, dans des conditions alcalines, PacC fait l'objet d'un traitement protéolytique supprimant la queue C-terminale de PacC. La forme ainsi clivée de PacC agit alors comme un répresseur transcriptionnel et régule un ensemble de gènes cibles afin d'induire des modifications adaptatives en réponse à ce changement de pH. Ce traitement protéolytique de PacC induit par le pH de la cellule est sous le contrôle de la voie biologique dite "voie de PacC" comme décrit dans la publication Maeda et al., "The signaling mechanism of ambient pH sensing and adaptation in yeast andfungi", FEBS Journal 279 (2012). Les inventeurs ont maintenant montré, pour la première fois, que cette voie biologique n'est pas uniquement responsable d'un effet senseur de pH. En effet, l'inactivation de cette voie conduit à une augmentation significative de la production de protéines cellulolytiques. Les inventeurs ont en outre déterminé, par comparaison avec l'homologue de PacC chez Aspergillus nidulans, que dans T. reesei, la maturation de la protéine PacC se fait en deux étapes essentielles de clivage aux positions suivantes:

un premier clivage entre les positions 480 et 503 de la séquence protéique de PacC chez T. reesei; et

un second clivage entre les positions 246 et 248 de la séquence protéique de PacC chez T. reesei.

Les inventeurs ont ainsi mis en évidence que des mutations sur ces zones de clivage spécifiques conduisent à la production d'une protéine PacC, dont la maturation post-traductionnelle est altérée et/ou empêchée. Une telle protéine est alors inactive, et la souche de T. reesei ainsi modifiée présente une amélioration de la production d'enzymes, en particulier d'enzymes cellulolytiques. Lesdites enzymes cellulolytiques sont préférentiellement une cellulase ou une hémicellulase, encore plus préférentiellement il s'agit d'une cellulase.

Par "séquence protéique native de PacC", on entend designer la séquence non mature telle qu'elle est produite, avant toute modification post-traductionnelle. La séquence protéique native de PacC est représentée en SEQ JD N°2 et compte 622 acides aminés.

Par "protéine active ou protéine mature de PacC", on entend désigner la protéine de PacC telle qu'obtenue à l'issue de modifications post-traductionnelles, en particulier d'un double clivage de ladite protéine native. La protéine mature de PacC comprend entre 246 et 248 acides aminés. Plus précisément, la séquence protéique de la protéine mature correspond respectivement aux 246 ou 248 premiers acides aminés de la séquence protéique de la protéine native (représentée en SEQ ID N°2).

Par "protéine inactive", ou "protéine immature", on entend designer une protéine PacC dont l'activité est altérée. Par "souche mutante", "mutant", "souche modifiée", "souche variante" ou encore "transformants", on entend désigner de manière indifférente dans la présente demande une souche de Trichoderma reesei selon l'invention, qui n'exprime pas la protéine PacC ou qui exprime une protéine immature. Cette souche est caractérisée par la présence d'une mutation choisie parmi :

une délétion du gène codant pour PacC, conduisant à l'absence complète de l'expression du gène, ou à la production d'une protéine immature ;

une mutation entre les positions 1 à 735 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 249 à 495;

une mutation entre les positions 736 à 744 de la séquence nucléotidique représentée en SEQ ID N° 1 ; et

une mutation entre les positions 1438 à 1515 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 1492 à 1494.

Ces souches sont caractérisées par:

l'absence de production de protéine PacC; ou

la production d'une protéine inactive PacC.

Dans ce dernier cas, ladite protéine inactive est préférentiellement tronquée. Elle se caractérise typiquement par une mutation au niveau protéique :

entre les positions 1 à 245 de la séquence protéique native de PacC, préférentiellement entre les positions 84 à 165 ;

entre les positions 246 à 248 de la séquence protéique native de PacC ; et/ou

entre les positions 480 à 503 de la séquence protéique native de PacC, préférentiellement en position 498, encore plus préférentiellement une substitution de la leucine en position 498 en sérine.

Dans un mode de réalisation particulier, l'invention concerne une souche de Trichoderma reesei dont le génome comprend une mutation choisie parmi: une mutation entre les positions 1 à 735 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 249 à 495 ;

une mutation entre les positions 736 à 744 de la séquence nucléotidique représentée en SEQ ID N° 1 ; et

une mutation entre les positions 1438 à 1515 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 1492 à 1494. Les techniques de mutations sont connues de l'homme du métier. Préférentiellement, les mutations seront obtenues par les techniques de recombinaisons génétiques. Dans le cas d'introduction d'une séquence d'ADN, on préférera particulièrement l'introduction d'une cassette de délétion. Bien entendu, il est possible de prévoir d'autres techniques assurant la mutation en cause, on pourra par exemple utiliser les systèmes de mutations connus de l'homme du métier, ainsi que les insertions ou autres modifications d'ADN obtenues par les techniques de recombinaison homologue. Par exemple des approches de mutagenèse dirigée par PCR ou de synthèse de gène pourraient être utilisées pour créer un gène tronqué ou muté dans les séquences essentielles à la maturation. La connaissance de telles méthodes appartient aux connaissances de l'homme du métier.

La cassette ainsi obtenue pourrait être utilisée pour remplacer la copie non mutée de PacC par recombinaison homologue dans le génome de la souche de référence.

Alternativement, l'homme du métier peut cibler l'activité de la protéine PacC, notamment à l'aide d'ARN interfèrent. Ces ARN permettent de réduire fortement l'expression d'une protéine. Pour ce faire, on introduit un petit ARN double brin qui entraîne l'inactivation spécifique d'un ARN messager.

Par conséquent, dans un premier mode de réalisation, l'invention concerne une souche dans laquelle le gène codant pour PacC est délété. Une telle délétion conduit indifféremment à l'absence de protéine PacC mature ou l'expression d'une protéine inactive, de préférence tronquée ou incomplète.

Préférentiellement, cette délétion est mise en œuvre par recombinaison homologue, typiquement à l'aide d'un vecteur.

Selon l'invention, on entend par « vecteur » toute séquence d'ADN dans laquelle il est possible d'insérer des fragments d'acide nucléique étranger, les vecteurs permettant d'introduire de l'ADN étranger dans une cellule hôte. Des exemples de vecteurs sont les plasmides, les cosmides, les chromosomes artificiels de levures (YAC), les chromosomes artificiels de bactéries (BAC) et les chromosomes artificiels dérivés du bactériophage PI (PAC), les vecteurs dérivés de virus. Le vecteur selon l'invention permet l'introduction d'une mutation ou d'une délétion.

Selon l'invention, l'acide nucléique tel que décrit précédemment pourra être lié opérationnellement à un promoteur, un terminateur ou toute autre séquence nécessaire à son expression dans la cellule hôte. Le vecteur selon l'invention pourra également porter un marqueur de sélection. On entend par « marqueur de sélection » un gène dont l'expression confère aux cellules qui le contiennent une caractéristique permettant de les sélectionner. Il s'agit par exemple d'un gène de résistance aux antibiotiques.

Préférentiellement, ledit vecteur est un plasmide. L'homme du métier pourra utiliser un plasmide de type :

YIP (Yeast Integrating Plasmid) : ce sont des vecteurs auxquels il manque l'origine de réplication dans la levure, donc qui doivent se propager comme un élément intégratif dans le chromosome de la levure et le plus souvent dans une seule copie par génome; YRP (Yeast Replicatif Plasmid) : ce sont des vecteurs qui présentent une séquence de réplication autonome (ARS), ce sont des plasmides instables et à réplication autonome;

YCP (Yeast Centromer Plasmid) : ces vecteurs présentent une origine de réplication et une séquence centromérique, ce sont des plasmides stables et qui se propagent en un faible nombre de copies; YEP (Yeast Episomal Plasmid) : ces vecteurs présentent un fragment de plasmide de levure de 2um, ils se propagent en un grand nombre de copies et ils ont une réplication autonome et une ségrégation irrégulière.

Plus préférentiellement, le plasmide est un plasmide de type YEP. Encore plus préférentiellement, il s'agit du plasmide pRS426. Ainsi, pour déléter le gène de PacC, l'homme du métier pourra avoir recours à un plasmide modifié pRS426 comprenant une cassette de délétion. Cette cassette de délétion vise à supprimer le gène de PacC, préférentiellement tel qu'il est représenté en SEQ ID N°3. Cette séquence SEQ ID N°3 représente la séquence génique de PacC (et inclut les introns).

La cassette de délétion est obtenue en plaçant une séquence d'intérêt sous le contrôle transcriptionnel d'un promoteur et d'un terminateur provenant d'un gène de levure. Le gène d'intérêt peut être modifié à l'aide d'enzymes de restrictions, en y plaçant par exemple la séquence codant pour un gène de sélection. Préférentiellement, ledit gène de sélection peut être choisi parmi le gène de orotidine 5-phosphate décarboxylase (pyr4) et le gène hygromycine B phosphotransférase (Hph).

Ainsi, la traduction du gène d'intérêt donne une protéine inactive (de préférence tronquée ou incomplète) ou la protéine d'intérêt n'est pas exprimée, du moins sous forme mature. Le transgène peut alors s'intégrer par recombinaison homologue au locus visé. Il faut alors trier les cellules qui ont subi la recombinaison homologue. Pour cela, il suffit de digérer l'ADN génomique par des enzymes de restriction qui permettent de discriminer le gène endogène non touché par l'insertion et le gène endogène modifié par le transgène. Lors d'une recombinaison homologue, deux éléments de recombinaison, un à chaque extrémité du gène, sont nécessaires pour cibler de façon précise le gène à déléter. Aussi, dans un mode de réalisation préféré, ladite cassette de délétion comprend trois fragments d'ADN:

une région en amont du gène cible; un marqueur sélectif, préférentiellement choisi parmi le gène de orotidine 5-phosphate decarboxylase de T.reesei (pyr4) et le gène hygromycine B phosphotransférase (Hph); et

une région en aval du gène cible.

Typiquement, les amorces utilisées pour l'amplification de la région en amont du gène cible chez T.reesei sont comme suit:

l'amorce sens est constituée de 29 nucléotides homologues de la séquence du plasmide pRS426, à proximité du site de restriction Xhol. Cette amorce sens est représentée en SEQ ID N°4 (GTAACGCCAGGGTTTTCCCAGTCACGACG) ; et

l'amorce antisens contient une séquence de 21 nucléotides homologues de la partie 3' du gène du marqueur sélectif pyr4, tels que représentés en SEQ ID N°5 (CG ACG ATATC AGCTTCC AT AT) , et 8 nucléotides du site de restriction Mmel, tels que représentés en SEQ ID N°6 (TCCGACTA), le tout formant la séquence SEQ ID N°7 (CGACGATATCAGCTTCCATATTCCGACTA).

Typiquement, les amorces antisens utilisées pour l'amplification de la région en aval du gène cible chez T. reesei sont comme suit :

l'amorce sens est constituée de 21 nucléotides homologues de la séquence en 5' du gène du gène du marqueur sélectif pyr4, tels que représentés en SEQ ID N°8 ( AG A A A AGC AC A A AG A AG AGGC) , et 8 nucléotides du site de restriction Mmel, tels que représentés en SEQ ID N°9 (TCCAACTA), le tout formant la séquence SEQ ID N°10 ( AG A A A AGC AC A A AG A AG AGGCTCC A ACT A) ; et

l'amorce antisens contient une séquence de 29 nucléotides homologues de la séquence du plasmide pRS426, à proximité du site de restriction EcoRI. Cette amorce sens est représentée en SEQ ID N°l l (GCGGATAACAATTTCACACAGGAAACAGC).

La cassette de délétion peut être ensuite amplifiée selon les techniques classiques bien connues de l'homme du métier, typiquement par une méthode choisie parmi le clonage classique, la fusion PCR, ou encore le clonage in vivo dans la levure par PCR.

Préférentiellement, cette cassette de délétion est amplifiée par PCR. La cassette de délétion est ensuite introduite par recombinaison dans une souche de T. reesei qui n'exprime pas un gène du marqueur de sélection, également appelée gène sélectif. L'homme du métier peut aisément identifier les gènes de marqueur de sélection pertinents pour la mise en œuvre de l'invention. Préférentiellement, ladite souche recombinée est une souche préalablement délétée pour le gène pyr4 ou le gène Hph.

Plus préférentiellement, ladite souche recombinée est une souche préalablement délétée pour le gène pyr4. L'homme du métier pourra se référer notamment à la publication Schuster, A., Bruno, K. S., Collett, J. R., Baker, S. E., Seiboth, B., Kubicek, C. P., & Schmoll, M. (2012). A versatile toolkit for high throughput functional genomics with Trichoderma reesei, Biotechnology for Biofuels, 5(1), 1 (doi: 10.1186/1754-6834-5-1). Après culture, les souches mutantes ayant incorporé la cassette de délétion sont sélectionnées en fonction de l'expression ou non du marqueur de sélection; les clones ayant été transformés exprimant ledit marqueur de sélection.

Dans un second mode de réalisation, l'invention concerne une souche dans laquelle une mutation est introduite, de telle sorte que la protéine PacC obtenue est inactive. Préférentiellement, ladite mutation est choisie parmi :

une mutation entre les positions 1 à 735 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 249 à 495;

- une mutation entre les positions 736 et 744 de la séquence nucléotidique représentée en SEQ ID N° 1 ; et

une mutation entre les positions 1438 et 1515 de la séquence nucléotidique représentée en SEQ ID N° 1. La séquence SEQ ID N° 1 correspond à la séquence nucléotidique codant pour la protéine PacC. Plus précisément, il s'agit d'un ADN complémentaire.

Ces mutations peuvent être insérées comme décrit précédemment à l'aide d'un plasmide, par exemple pUC19.

L'insertion de la mutation entre les positions 1 à 735 de la séquence nucléotidique représentée en SEQ ID N°l est exemplifiée à l'exemple 9. Typiquement, cette mutation peut être mise en œuvre grâce à la séquence telle que représentée en SEQ ID N°30. Cette séquence est ensuite amplifiée, par exemple par PCR à l'aide d'amorces sens et antisens, respectivement représentées en SEQ ID N°31 et 32. Après amplification, le produit de PCR correspondant ainsi que le marqueur sélectif sont introduits dans une souche T. reesei.

L'insertion de la mutation entre les positions 249 à 495 de la séquence nucléotidique représentée en SEQ ID N°l est exemplifiée à l'exemple 10. Typiquement, cette mutation peut être mise en œuvre grâce à la séquence telle que représentée en SEQ ID N°40. Cette séquence est ensuite amplifiée, par exemple par PCR à l'aide d'amorces sens et antisens, respectivement représentées en SEQ ID N°31 et 32. Après amplification, le produit de PCR correspondant ainsi que le marqueur sélectif sont introduits dans une souche T. reesei.

L'insertion de la mutation entre les positions 736 à 744 de la séquence nucléotidique représentée en SEQ ID N°l est exemplifiée à l'exemple 11. Typiquement, cette mutation peut être mise en œuvre grâce à la séquence telle que représentée en SEQ ID N°43. Cette séquence est ensuite amplifiée, par exemple par PCR à l'aide d'amorces sens et antisens, respectivement représentées en SEQ ID N°31 et 32. Après amplification, le produit de PCR correspondant ainsi que le marqueur sélectif sont introduits dans une souche T. reesei. L'insertion de la mutation entre les positions 1438 à 1515 de la séquence nucléotidique représentée en SEQ ID N°l est exemplifiée à l'exemple 12. Typiquement, cette mutation peut être mise en œuvre grâce à la séquence telle que représentée en SEQ ID N°47. Cette séquence est ensuite amplifiée, par exemple par PCR à l'aide d'amorces sens et antisens, respectivement représentées en SEQ ID N°48 et 49. Après amplification, le produit de PCR correspondant ainsi que le marqueur sélectif sont introduits dans une souche T. reesei.

L'insertion de la mutation entre les positions 1492 à 1494 de la séquence nucléotidique représentée en SEQ ID N°l est exemplifiée à l'exemple 13. Typiquement, cette mutation peut être mise en œuvre grâce à la séquence telle que représentée en SEQ ID N°54. Cette séquence est ensuite amplifiée, par exemple par PCR à l'aide d'amorces sens et antisens, respectivement représentées en SEQ ID N°48 et 49. Après amplification, le produit de PCR correspondant ainsi que le marqueur sélectif sont introduits dans une souche T. reesei.

Ces mutations au niveau nucléotidique conduisent à la production d'une protéine inactive. Plus précisément, ces mutations sont respectivement responsables :

d'une mutation entre les positions 1 à 245 de la séquence protéique de PacC, préférentiellement entre les positions 84 à 165;

d'une mutation entre les positions 246 et 248 de la séquence protéique de PacC; et

d'une mutation entre les positions 480 et 503 de la séquence de la séquence protéique de PacC, préférentiellement en la position 498.

La séquence protéique de PacC est représentée en SEQ ID N°2.

Ces mutations sont particulièrement pertinentes dans le cadre de l'invention comme détaillé ci-après. Dans un premier aspect, la mutation concerne les positions 1 à 245 de la séquence protéique de PacC. Ces positions correspondent au domaine de fixation à l'ADN. Plus spécifiquement, la mutation concerne les positions 84 à 165 de la séquence protéique de PacC, qui comprennent les motifs à doigt de zinc. Dans un second aspect, la mutation concerne les positions 246 à 248 de la séquence protéique. Ces positions correspondent à une zone de clivage de la protéine PacC, ledit clivage étant nécessaire à la maturation de ladite protéine. Une mutation sur ces positions conduit donc à une absence de clivage de la protéine PacC et ainsi son maintien à un état inactivé. Dans un troisième aspect, la mutation concerne les postions 480 à 503 de la séquence protéique de PacC. Ces positions correspondent à une zone de clivage de la protéine PacC, ledit clivage étant nécessaire à la maturation de ladite protéine. Une mutation sur ces positions conduit donc également à une absence de clivage de la protéine PacC et ainsi son maintien à un état inactivé.

Par conséquent, l'invention concerne également une souche de T. reesei exprimant une protéine PacC inactive, qui présente au moins une mutation :

entre les positions 1 à 245 de la séquence protéique de PacC, c'est à dire sur le domaine de fixation à l'ADN de la protéine PacC, préférentiellement entre les positions 84 à 165 de ladite séquence, qui correspondent au domaine à doigt de zinc;

entre les positions 246 à 248 de la séquence protéique de PacC, qui correspondent aux positions auxquelles un clivage a lieu lors de la maturation post-traductionnelle de la protéine PacC; ou

entre les positions 480 à 503 de la séquence protéique de PacC, préférentiellement en la position 498, plus préférentiellement une mutation Leu498Ser, qui correspond aux positions auxquelles un clivage a lieu lors de la maturation post-traductionnelle de la protéine PacC.

Dans un troisième mode de réalisation, l'invention concerne une souche de T. reesei dont le génome présente une mutation affectant l'expression d'une protéine choisie parmi RIM8, RIM9, RIM13, RIM20, REV121. Les séquences de ces protéines sont accessibles en ligne.

RIM13 (également dénommé Palb) se retrouve notamment dans la souche T. reeisei Tr 70560 et sa séquence est disponible sous le lien: http://genome.igi- psf.org/cgi-bin/dispGeneModel?db=Trire2&id=70560.

RIM20 (également dénommé PalA) se retrouve notamment dans la souche T. reeisei Trl24132 et sa séquence est disponible sous le lien: http://genome.j gi- psf .org/cgi-bin/dispGeneModel?db=Trire2&id= 124132. RIM9 (également dénommé PalL) se retrouve dans la souche T. reeisei Tr21415 et sa séquence est disponible sous le lien: http://genome.j i-psf.org/cgi- bin/dispGeneModel?db=Trire2&id=21415.

RIM21 (également dénommé PalH) se retrouve dans la souche T. reeisei Trl23296 et sa séquence est disponible sous le lien: http://genome.j i-psf.org/cgi- bin/cUspGeneModel?db=Trire2&id^l23296.

Ces mutations ont pour effet l'absence de production desdites protéines ou l'expression de telles protéines inactives. Ces mutations dans une souche de T.reesei conduisent à une absence du traitement protéolytique de PacC, ce qui améliore la production d'enzymes par la souche ainsi mutée. En effet, l'organisation et le fonctionnement de la voie RIM101 sont conservés dans de nombreuses levures et champignons filamenteux, notamment S.cerevisiae et A. nidulans. La voie se compose de plusieurs composants dont RIM8, RIM9, RIM13, RIM20, RIM21. Des souches dont au moins l'une de ces composantes a été supprimée sont caractérisées par une absence du traitement protéolytique de PacC, ce qui confirme leur rôle dans le déclenchement de l'activité de PacC.

L'invention porte également sur l'utilisation de la souche selon l'invention pour la production d'enzymes cellulolytiques. Aussi, dans un mode de réalisation particulier, l'invention concerne l'utilisation d'une souche de Trichoderma reesei pour la production d'enzymes cellulolytiques, ladite souche étant choisie parmi:

une délétion du gène codant pour PacC;

une mutation entre les positions 1 à 735 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 249 à 495;

une mutation entre les positions 736 à 744 de la séquence nucléotidique représentée en SEQ ID N° 1 ; et

une mutation entre les positions 1438 à 1515 de la séquence nucléotidique représentée en SEQ ID N°l, préférentiellement entre les positions 1492 à 1494.

L'invention porte également sur l'utilisation de la souche selon l'invention pour l'hydrolyse du cellobiose en glucose. L'invention a également pour objet, l'utilisation de la souche selon l'invention pour la production de biocarburant. Selon l'invention, le terme "biocarburant" peut être défini comme tout produit issu de la transformation de la biomasse et pouvant être utilisé à des fins énergétiques. D'une part et sans vouloir se limiter, on peut citer à titre d'exemple des biogaz, des produits pouvant être incorporés (éventuellement après transformation ultérieure) à un carburant ou être un carburant à part entière, tels que des alcools (l'éthanol, le butanol et/ou l'isopropanol selon le type d'organisme fermentaire utilisé), des solvants (acétone), des acides (butyrique), des lipides et leurs dérivés (acides gras à courtes ou longues chaînes, esters d'acides gras), ainsi que l'hydrogène.

De manière préférée, le biocarburant selon l'invention est un alcool, par exemple l'éthanol, le butanol et/ou l'isopropanol. Plus préférentiellement, le biocarburant selon l'invention est l'éthanol. Dans un autre mode de réalisation, le biocarburant est du biogaz.

L'invention concerne également l'utilisation de la souche selon l'invention pour l'hydrolyse des beta-oligosaccharides.

Enfin, l'invention concerne l'utilisation de la souche selon l'invention pour l'hydrolyse du cellobiose en glucose.

FIGURES

Figure 1: Représentation du plasmide pRS426.

Figure 2: Production de protéines extracellulaires par des souches mutantes selon l'invention et des souches T. reesei non modifiées après 7 jours de culture.

Figure 3: Productivité spécifique des souches mutantes selon l'invention après 7 jours de culture.

Figure 4 : Production de protéines extracellulaires pour un mutant selon l'invention par rapport à la souche de T. reesei non modifiée

EXEMPLES

Exemple 1 : Culture de Trichoderma reesei pour l'analyse du transcriptome et analyse des réponses cellulaires lors de l'induction de la production d'enzymes cellulolytiques

Protocole de culture

Dans cette étude, les inventeurs ont utilisé les souches de Trichoderma reesei suivantes:

- NG14 (ATCC 56767), et

- RUT C30 (ATCC 56765).

Des spores congelés ont été utilisés pour ensemencer une fiole de Fernbach contenant 250 ml de milieu de culture ayant la composition suivante: glucose à 30 g.L "1 ; cornsteep 2 g.L "1 , (NH 4 ) 2 S0 4 à 1,4 g L "1 ; KOH à 0,8 g.L "1 ; H 3 P0 4 à 85 %

4 mL.L "1 ; acide phtalique , sel dipotassique 5 g L " 1 ; MgS0 4 .7H 2 0 à 0,3 g L "1 ;

CaCl 2 à 0,3 g L "1 ; FeS0 4 .7H 2 0 à 5,0 mg L "1 ; MnS0 4 .H 2 0 à 1,6 mg.L "1 ;

ZnS0 4 .7H 2 0 à 1,4 mg.L "1 ; CoCl 2 .6H 2 0 à 2,0 mg.L "1 ; à un pH de 6.

La culture a été effectuée à 30°C sous agitation à 150 tours par minute (rpm). Après 72 h, le milieu contenant le mycélium a été utilisé comme inoculum pour la culture en bioréacteur.

Pour l'induction de la production des enzymes cellulolytiques, un bioréacteur de 4 litres a été utilisé durant un protocole de culture en deux étapes. Les souches ont d'abord été cultivées à 28 0 C dans 2 L de milieu décrit ci-dessus et le pH régulé à 4,8 avec du NH 3 à 5,5 M.

Le débit d'air a été ajusté à 0,5 volume par volume par min (VVM), et l'agitation initiale a été fixée à 400 tours par minute. Ce paramètre a été graduellement élevé pour maintenir une pression partielle d'02 (p02) au-dessus de 40% de la saturation en oxygène. Lorsque le glucose initial était proche de l'épuisement (<20% de la teneur initiale en glucose), l'étape dite de "fed-batch" a été initiée.

Au cours de cette deuxième étape, une solution de source de carbone inductrice de la production d'enzymes (lactose) a été injectée à un débit de 0,98 g.h "1 pour initier la production des enzymes cellulolytiques. Prélèvement des échantillons et traitement des échantillons

Des échantillons ont été prélevés périodiquement pour déterminer la production de biomasse, la consommation de glucose et la production de protéines extracellulaires.

Pour l'isolement de l'ARN, des échantillons ont été prélevés avant l'injection de lactose et respectivement lh, 3h, 6h et 24h après l'injection de lactose.

Les concentrations de biomasse ont été déterminées par analyse gravimé trique. Dix millilitres de milieu de culture contenant du mycélium recueilli a été filtré à l'aide de membrane en microfibres de verre GF/C ayant des pores à 1,2 μιη. La biomasse sèche a été déterminée 24h après l'incubation de la membrane à 105 0 C. La concentration de glucose au cours de la phase dite de "batch" a été évaluée par la réaction enzymatique à l'aide d'un analyseur de glucose Analox GM10 (Imlab) pour déterminer le moment opportun pour initier l'étape de fed-batch.

Toutes les concentrations des sources de carbone ont été quantifiées a posteriori par HPLC à l'aide une colonne HPX- 87p (Biorad) maintenue à 85°C. De l'eau distillée dégazée a été utilisée comme éluant à un débit de 0,4 mL.L "1 .

Les concentrations de protéines extracellulaires ont été quantifiées par le kit de dosage de protéine Bradford (Bio-Rad) avec de l'albumine de sérum bovin (BSA) comme étalon (0 à 2,0 g L "1 de gamme avec une régression du deuxième ordre).

Exemple 2 : Isolement et purification des ARNs et hybridation aux puces à ADN

Pour l'isolement des ARNs, des échantillons de mycélium ont été filtrés, lavés avec de l'eau froide distillée, immédiatement congelés dans de l'azote liquide et broyés jusqu'à l'obtention d'une poudre de mycélium.

La poudre a été soumise à un traitement par le phénol en utilisant la solution de réactif TRI (Applied Biosystems). L'ARN total extrait a ensuite été isolé à l'aide du bromochloropropane (Sigma), précipité avec de l'isopropanol (Sigma), lavé avec de l'éthanol, et solubilisé dans de l'eau exempte de nucléase (Qiagen) selon les instructions du fabricant. Les échantillons ont été lavés en suivant la procédure RNeasy de Qiagen et ont été soumis à une digestion DNase sur colonne à l'aide du kit RNAse-Free DNAse set (Qiagen).

Les ARNs de chaque expérience ont fait l'objet d'une transcription inverse et ont été marqués à l'aide des fluorochromes Cy3 ou Cy5 (Invitrogen) en utilisant la procédure de marquage indirect.

Ensuite, 1 μg d'ADNc marqué a été hybridé à l'aide de la puce à ADN de T. reesei 8x60k fabriqué par Agilent et conçue en utilisant le logiciel Teloenn comme décrit notamment par Jourdren et al., 2010. Exemple 3 : Traitement des données obtenues des puces à ADN et analyse l'analyse de l'expression des gènes des cultures induites

Les essais ont été analysés à l'aide d'un scanner Agilent G2565CA et les signaux analysés par le logiciel GenePix Pro 6.1.

Les données brutes d'intensités mesurées sur les puces à ADN sont normalisées par la méthode Lowess globale (locally weighted polynomial régression) au moyen du programme Goulphar [Lemoine et al, 2006].

L'analyse de l'expression des gènes a été réalisée au moyen de scripts spécifiquement développés pour le traitement des fichiers de données normalisées. Pour chaque condition expérimentale, les spots présentant une intensité de fluorescence inférieure à la moyenne ajoutée de deux écarts types du bruit de fond sur l'ensemble de la puce ont été considérés comme non détectés et éliminées de l'analyse.

Pour chaque sonde le rapport log2 d'hybridation a été associé à l'annotation du génome selon le génome T. reesei (v2.0) (http://genome.jgi- p sf . or g/Trire2/Trire2.home .html) . Le rapport log2 final pour chaque transcrit a été obtenu en moyennant les valeurs d'hybridation détectées de l'ensemble des sondes positionnées sur le brin codant et à l'intérieur de la séquence codante correspondante. Les transcrits ne possédant aucune ou une seule sonde considérée comme détectée ont été éliminés. Les résultats issus des réplicats biologiques et techniques ont été traités parallèlement et indépendamment.

À l'issue de la procédure, l'analyse différentielle a été effectuée à l'aide d'une modélisation linéaire (lmFit) et de tests bayésiens (eBayes), implémentés dans le package R limma [Smyth, GK et al, 2004] pour chaque condition. Les p-values ont été ajustées par la méthode de correction des tests multiples de Benjamini- Hochberg, et considérés comme significatives quand elles sont inférieures à 0,05. Enfin, seuls les transcrits présentant un rapport log2 d'hybridation supérieur à 1 ou inférieur à -1, ont été conservés comme les cibles les plus fortement régules.

Une matrice d'expression regroupant les rapports log2 d'hybridation de chaque gène pour chacune des conditions expérimentales testées est réalisée. Dans cette matrice, seuls les gènes qui étaient différentiellement exprimés dans au moins une condition expérimentale testée ont été retenus.

La matrice d'expression finale obtenue par les inventeurs contenait alors 592 gènes exprimés de manière différentielle pendant l'induction par le lactose de la production d'enzyme cellulolytique.

Une liste de 16 gènes cibles a alors été établie après une analyse détaillée sélectionnant les gènes présentant l'expression différentielle la plus élevée et susceptibles d'avoir une fonction dans la production d'enzymes cellulolytiques. Parmi cette liste, les inventeurs ont sélectionné le gène TRIRE120698 (orthologue de RIM101 de S. cerevisiae et de PacC de A. niger) pour des analyses supplémentaires.

Afin d'évaluer l'effet de ce gène sur la production de protéines, et plus particulièrement la production d'enzymes cellulolytiques telles que les cellulases et les hémicellulases, une cassette de délétion a été construite de manière à supprimer in vivo le gène de PacC par recombinaison homologue. Exemple 4: Construction de la cassette de délétion de gène pour PacC

La cassette de délétion est composée de trois fragments d'ADN :

une région en amont du gène cible, d'environ 1 kb

le gène orotidine -5'-phosphate décarboxylase de T. reesei (pyr4, TRIRE0074020) comme marqueur de sélection, et

la région en aval du gène cible, d'environ 1 kb.

Le plasmide pRS426 a été utilisé comme vecteur pour la construction de la cassette de délétion par recombinaison in vivo dans S. cerevisiae selon une méthode inspirée de la littérature (Schuster, A., Bruno, K. S., Collett, J. R., Baker, S. E., Seiboth, B., Kubicek, C. P., & Schmoll, M. (2012). A versatile toolkit for high throughput junctional genomics with Trichoderma reesei. Biotechnology for Biofuels, 5(1), 1. doi: 10.1186/1754-6834-5-1). Pour ce faire, elle a été digérée avec EcoRI et Xhol (New England Biolabs) et purifiée par électrophorèse sur gel en utilisant QIAquick Gel Extraction Kit (Qiagen). Ce plasmide utilisé pour la modification est représentée en figure 1.

Amplification de la région en amont du gène cible chez T. reesei QM9414

Les amorces utilisées pour l'amplification de la région en amont du gène cible à partir de T. reesei QM9414 sont décrits ci-après.

L'amorce sens est constituée d'une partie générale de 29 nucléotides (nt) homologues de la séquence du vecteur pRS426 à proximité du site de restriction Xhol (GTAACGCCAGGGTTTTCCCAGTCACGACG ) ( SEQ ID NO : 4).

La partie générale de l'oligonucléotide a été suivie de la séquence spécifique correspondant à 20 nt de la région amont du gène de PacC.

L'amorce antisens contient une partie générale constituée de 21 nucléotides homologues à l'extrémité 3' du gène du marqueur sélectif pyr4 (CGACGATATCAGCTTCCATAT) (SEQ ID NO: 5) et de 8 nucléotides du site de restriction Mmel (TCCGACTA) (SEQ ID NO: 6), le tout formant la séquence CGACGATATCAGCTTCCATATTCCGACTA (SEQ ID NO: 7). La partie générale de l'oligonucléotide a été suivie de la séquence spécifique correspondant à 20 nucléotides de la région amont du gène de PacC.

Les parties de l'amorce spécifiques du gène cible ont été conçues sur la base de la prédiction ORF dans la version v2.0 du génome (http://genome.j gi- p sf . or g/Trire2/Trire2. home .h tml) .

Les amorces utilisées pour l'amplification de la région en amont du gène cible à partir de l'ADN T. reesei QM9414 comme matrice ont donc été les suivantes : > 120698 amont-amorce sens: SEQ ID NO: 8

GTAACGCCAGGGTTTTCCCAGTCACGACGGAAGAACTAGAAGACGGAGC

> 120698 amont-amorce antisens: SEQ ID NO: 9

CGA CGA TA TCA GCTTCCA TA TTCCGA CTAA TGA GGAA GACTGTAGGAGG

Ces amorces permettent d'amplifier un fragment de zone intergénique de taille adéquate pour la recombinaison. Amplification de la région en aval du gène cible PacC

Les amorces utilisées pour l'amplification de la région en aval du gène cible à partir de T. reesei QM9414 sont décrits ci-après. L'amorce sens contient une partie générale constituée de 21 nucléotides homologues à l'extrémité 5' du gène du marqueur sélectif pyr4 (AGAAAAGCACAAAGAAGAGGC) (SEQ ID NO: 10) et de 8 nucléotides du site de restriction Mmel (TCCAACTA) (SEQ ID NO: 11), le tout formant ainsi la séquence AGAAAAGCACAAAGAAGAGGCTCCAACTA (SEQ ID NO: 12).

La partie générale de l'oligonucléotide a été suivie de la séquence génique spécifique correspondant à 20 nt de la région en aval du gène de PacC.

L'amorce antisens contient une séquence de 29 nucléotides homologues de la séquence de vecteur pRS426 à proximité du site de restriction EcoRI (GCGGATAACAATTTCACACAGGAAACAGC ) (SEQ ID NO: 13).

La partie générale de l'oligonucléotide a été suivie de la séquence génique spécifique correspondant à 20 nucléotides de la région en aval du gène de PacC.

Les parties de l'amorce spécifiques du gène cible ont été conçues sur la base de la prédiction ORF dans la version v2.0 du génome (http://genome._i gi- p sf. or g/Trire2/Trire2.home .h tml) . Les amorces utilisées pour l'amplification de la région en aval du gène cible à partir de l'ADN de T. reesei QM9414 comme matrice ont été les suivantes :

> 120698 aval-amorce sens : SEQ ID NO: 14

5'AGAAAAGCACAAAGAAGAGGCTCCAACTAACGACTGACTCTCAGTGACG

> 120698 aval-amorce antisens: SEQ ID NO: 15

5'GCGGATAACAATTTCACACAGGAAACAGCACACTTGTCTGCTTGTCTCG Ces amorces permettent d'amplifier un fragment de zone intergénique de taille adéquate pour la recombinaison.

Amorces utilisées pour l'amplification du gène de marqueur sélectif Les amorces utilisées pour l'amplification du gène de pyr4 à partir de T. reesei QM9414 ont été les suivantes :

L'amorce sens contient une partie générale constituée de 8 nucléotides du site de restriction Mmel (TAGTTGGA) (SEQ ID NO : 16) et 21 nucléotides de la séquence du gène spécifique de l'extrémité 5 ' de TRIRE0074020 (pyr4) (GCCTCTTCTTTGTGCTTTTCT) , (SEQ ID NO: 17), le tout formant ainsi la séquence TAGTTGGAGCCTCTTCTTTGTGCTTTTCT (SEQ ID NO: 18).

L'amorce antisens contient une partie générale constituée de 8 nucléotides du site de restriction Mmel (TAGTCGGA) (SEQ ID NO : 19) et 21 nucléotides de la séquence du gène spécifique de l'extrémité 3' de pyr4 ( AT ATGG A AGCTG AT ATCGTCG) , (SEQ ID NO: 20), le tout formant la séquence TAGTCGGAATATGGAAGCTGAT ATCGTCG (SEQ ID NO: 21). Les parties de l'amorce spécifiques du gène cible ont été conçues sur la base de la prédiction ORF dans la version v2.0 du génome (httpJ/genome.j gi- p sf . or g/Trire2/Trire2. h orne . html ) . Les amorces utilisées pour l'amplification de la région en aval du gène cible à partir de l'ADN de T. reesei QM9414 comme matrice ont été les suivantes :

> pyr4 amorce sens : SEQ ID NO: 22

5 ' - TA GTTGGA GCCTCTTCTTTGTGCTTTTCT pyr4 amorce antisens : SEQ ID NO: 23

5 ' - TAGTCGGAATATGGAAGCTGATATCGTCG Les PCR mises en œuvre à l'aide des amorces ci-dessus ont donné lieu à des fragments d'ADN à extrémités homologues. Ces fragments d'ADN ainsi que le plasmide pRS426 digéré ont été transformés dans une souche Saccharomyces cerevisiae W303 compétente. Exemple 5: Construction d'une souche QM9414 de T. reesei délétée du gène PacC

Les plasmides pRS426 contenant la cassette de délétion du gène de PacC ont été extraits de S. cerevisiae et utilisés comme matrice pour amplifier par PCR la cassette de délétion en utilisant les amorces 120698 amont-amorce sens (SEQ ID NO : 8) et 120 698 en aval-amorce antisens (SEQ ID NO: 15).

Le produit de la PCR a ensuite été transformé dans une souche T. reesei QM9414 Atku70 - pyr4 (Schuster, A., Bruno, K. S., Collett, J. R., Baker, S. E., Seiboth, B., Kubicek, C. P., & Schmoll, M. (2012). A versatile toolkit for high throughput functional genomics with Trichoderma reesei. Biotechnology for Biofuels, 5(1), 1. doi: 10.1186/1754-6834-5-l).

Les transformants ont été sélectionnés sur la base de la fonction de gène marqueur de sélection pyr4, présent dans la cassette de délétion. Les mutants ont été purifiés à partir des colonies issues de spores individuelles et, au final, six transformants ont été retenus. L'intégration de la cassette a été confirmée par l'absence d'une amplification par PCR du gène cible et par l'amplification par PCR des séquences flanquantes du site d'insertion. La séquence adjacente en amont du site d'insertion a été amplifiée par PCR en utilisant une amorce qui se lie en amont du site d'insertion et une amorce qui se lie au gène marqueur. Pour la séquence en aval du site d'insertion, une amorce qui se lie au gène marqueur et une amorce qui se lie en aval du site d'insertion ont été utilisés.

Les amorces utilisées pour l'amplification ;

- du gène cible,

du site d'insertion en région en amont dudit gène cible; et

du site d'insertion de la région en aval du gène cible,

à l'aide de l'ADN génomique de T. reesei à partir des mutants purifiés comme matrice ont été les suivantes :

> Gène PacC - amorce sens : SEQ ID NO: 24

5 ' - CCCAGCCCCGAGCTATTATG

> Gène PacC -amorce antisens : SEQ JD NO: 25

5 ' - GACCGGTTGACTGAGGGAAG

Région en amont du gène PacC - amorce sens : SEQ ID NO: 26

5 ' - ATTCGGCTGCTGGAGATATG Marqueur de sélection - antisens : SEQ ID NO: 27

5 ' - CCTCTTTTTCCATCTTGTC Marqueur de sélection - sens : SEQ ID NO: 28

5 ' - ATCCGAGCGTGAGCATCAAA Région en aval du gène PacC - amorce antisens : SEQ ID NO: 29

5 ' - AATGGCGGGCTTTATTTCGC Exemple 6: Culture de la souche de T. reesei QM9414 dépourvue du gène PacC et analyse des cultures pour la production de protéines et la croissance.

Les spores provenant de six mutants qui présentent une délétion du gène PacC et la souche de T. reesei QM9414 Atku70 - pyr4 non modifiée ont été utilisés pour ensemencer une plaque de culture à 6 puits contenant 5 ml de milieu de culture par puits.

Le milieu était composé de K2HP04 8,7 g.L "1 ; (NH 4 ) 2 S0 4 4,2 g.L "1 ; MgS0 4 .7H 2 0 0,3 g.L "1 ; cornsteep 1,5 g.L "1 ; Lactose 10 g.L "1 ; Cellulose 10 g.L " acide maléique 11,6 g.L "1 ; CaCl 2 0,3 g.L "1 ; FeS0 4 .7H 2 0 5,0 mg.L "1 ; MnS0 4 .H 2 0 1,6 mg.L "1 ; ZnS0 4 .7H 2 0 1,4 mg.L "1 ; CoCl 2 .6H 2 0 2,0 mg.L "1 ; pH 6 .

La culture a été effectuée à 30°C sous agitation à 150 rpm, en double exemplaire. Après 7 jours de culture, le surnageant a été recueilli pour mesurer la concentration en protéines dans le milieu. La production de protéines extracellulaires des cultures est présentée dans la Fig. 2. Cette figure montre une augmentation de la production de protéines pour les six mutants par rapport à la souche de T. reesei non modifiée.

Une culture de trois transformants et la souche T. reesei QM9414 Atku70 - pyr4 non modifiés a été réalisée en fioles de 250 ml contenant 50 ml du même milieu de culture pour suivre la production de protéines extracellulaires obtenir une mesure de la vitesse spécifique de production de la protéine (production de protéine par mg de biomasse fongique par unité de temps, ou qP) à la fin de la culture.

Ces valeurs sont présentées en Fig. 3.

Les données montrent des valeurs qP améliorées chez les mutants par rapport à la souche de T. reesei non modifiée.

Exemple 7 : construction d'une cassette de délétion pour le gène PacC pour une souche hyper-productrice et construction de la souche, Les souches hyper-productrices telles que RUT C30 et CL847 (Durand, H., Clanet, M., & Tiraby, G. (1988). Genetic Improvement of Trichoderma reeseifor large scale cellulase production. Enzyme and Microbial Technology, 10, 341- 346.) ne sont pas auxotrophes pour l'uracile.

Un autre marqueur de sélection doit être utilisé.

La cassette de délétion est composée de trois fragments d'ADN :

une région en amont du gène cible, d'environ 1 kb ;

- une cassette HygroR contenant le gène Hph (hygromycine B phosphotransférase) responsable de la résistance à l'hygromycine B) isolé d'Escherichia coli placé sous le contrôle du promoteur du gène cpc-1 de Neurospora crassa (NCU04050) et le terminateur du gène trpC d'Aspergillus nidulans ANID_00648) ; et

- la région en aval du gène cible, d'environ 1 kb.

Les séquences suivantes ont été amplifiées indépendamment à l'aide d'amorces ayant des régions communes avec les fragments à fusionner :

la région 5 'du gène PacC (SEQ ID N°55) à l'aide des amorces sens SEQ ID N°58 et antisens SEQ ID N°59 ;

de la région 3' du gène PacC (SEQ IDN°56) à l'aide des amorces sens SEQ ID N°60 et antisens SEQ ID N°61 ;

- la cassette hygroR (SEQ ID N°57) à l'aide des amorces sens SEQ ID N°62 et antisens SEQ ID N°63.

Ainsi, la SEQ ID N°55 possède en amont 20 nt en commun avec le plasmide pUC19 et 20 nt en aval commun avec la cassette hygroR, la SEQ ID N°57 possède en amont 20nt en commun avec la région 5' en amont de RIMIOI et en aval 20nt en commun avec la région 3' en aval du gène RIMIOI, la SEQ ID N°56 possède en amont 20 nt en commun avec la cassette hygroR et en aval 20 nt en commun avec le plasmide pUC19. Les fragments ont ensuite été assemblés à l'aide du kit d'assemblage Gibson Assembly® Master Mix (NEB) dans le plasmide pUC19 et amplifiés dans E. Coli. Le fragment contenant les régions flanquantes 3' et 5' du gène RIM101 avec au milieu la cassette hygroR a été amplifié à l'aide des amorces sens SEQ ID N°64 et antisens SEQ ID N°65.

Les transformants ont été sélectionnés sur la base de la fonction de gène marqueur de sélection pyr4, présent dans la cassette de délétion. Les mutants ont été purifiés à partir des colonies issues de spores individuelles et, au final, six transformants ont été retenus.

L'intégration de la cassette a été confirmée par l'absence d'une amplification par PCR du gène cible et par l'amplification par PCR des séquences flanquantes du site d'insertion. La séquence adjacente en amont du site d'insertion a été amplifiée par PCR en utilisant une amorce qui se lie en amont du site d'insertion et une amorce qui se lie au gène marqueur. Pour la séquence en aval du site d'insertion, une amorce qui se lie au gène marqueur et une amorce qui se lie en aval du site d'insertion ont été utilisées.

Un clone de la souche CL847 a ensuite été transformé avec 5μg du fragment obtenu selon la méthode connue de l'homme de l'art (Penttilà, M., Nevalainen, H., Ràttô, M., Salminen, E., & Knowles, J. (1987). A versatile transformation System for the cellulolytic filamentous fungus Trichoderma reesei. Gene, 61, 155- 164.).

Les transformants ont été sélectionnés sur la base de la fonction du marqueur de sélection Hph (hygromycine B phosphotransférase) responsable de la résistance à l'hygromycine B placé sous le contrôle du promoteur du gène cpc-1 de Neurospora crassa (NCU04050) et le terminateur du gène trpC d'Aspergillus nidulans ANID_00648), par sélection en milieu riche PDA (Difco) additionné de 50 μg d'hygromycine. Les mutants résistant à l'hygromycine ont été purifiés à partir des colonies issues de spores individuelles. Un transformant a été sélectionné : CL847-Driml01-C8.

Le remplacement du gène PacC par la cassette HygroR dans le transformant a été vérifié par :

par l'absence d'une amplification par PCR du gène cible à l'aide des amorces sens SEQ ID N°66 et antisens SEQ ID N°67 ;

par l'amplification par PCR des séquences flanquantes du site d'insertion. La séquence adjacente en amont du site d'insertion a été amplifiée par PCR en utilisant une amorce qui se lie en amont du site d'insertion et une amorce qui se lie au gène marqueur (amorces sens SEQ ID N°68 et antisens SEQ ID N°69). Pour la séquence en aval du site d'insertion, une amorce qui se lie au gène marqueur et une amorce qui se lie en aval du site d'insertion ont été utilisés (amorces sens SEQ ID N°70 et antisens SEQ ID N°71).

Exemple 8 : Culture de la souche de T. reesei CL847 dépourvue du gène PacC et analyse des cultures pour la production de protéines Les spores provenant du mutant qui présentant une délétion du gène PacC et la souche d'origine T. reesei CL847 non modifiée ont été utilisés pour ensemencer une plaque de culture à 24 puits contenant 2 ml de milieu de culture par puits.

Le milieu était composé de K2HP04 8,7 g.L "1 ; (NH 4 ) 2 S0 4 4,2 g.L "1 ; MgS0 4 .7H 2 0 0,3 g.L "1 ; cornsteep 1,5 g.L "1 ; Lactose 10 g.L "1 ; Cellulose 10 g.L " acide maléique 11,6 g.L "1 ; CaCl 2 0,3 g.L "1 ; FeS0 4 .7H 2 0 5,0 mg.L "1 ; MnS0 4 .H 2 0 1,6 mg.L "1 ; ZnS0 4 .7H 2 0 1,4 mg.L "1 ; CoCl 2 .6H 2 0 2,0 mg.L "1 ; pH 6 .

La culture a été effectuée à 30°C sous agitation à 150 rpm, en double exemplaire. Après 7 jours de culture, le surnageant a été recueilli pour mesurer la concentration en protéines dans le milieu. La production de protéines extracellulaires des cultures est présentée dans la Figure. 4. Cette figure montre une augmentation de la production de protéines pour le mutant (CL847-Driml01- C8) par rapport à la souche de T. reesei non modifiée (CL847). Exemple 9 : Construction d'une cassette de délétion des positions 1 à 735 de

SEQ ID N°l

Une séquence nucléotide synthétique été dessinée, synthétisée puis a été introduite dans le plasmide pUC19. Cette séquence (SEQ ID N°30) contient :

la séquence de SEQ ID N° 1 avec une délétion des 735 premières bases ;

une région en amont du gène cible d'environ 1 kb.

Le plasmide pUC19-RUC19-RIM101-735-4152 contenant la séquence synthétique a été utilisé comme matrice pour amplifier la SEQ ID N°30 par PCR en utilisant les amorces sens 31-R (SEQ ID N° 31) et antisens 30-F (SEQ ID N° 32).

La cassette de sélection PYR4 contenant le gène PYR4 avec environ l,2kb en amont du gène et 0.6kb en aval du gène (SEQ ID N° 33) a été amplifiée à partir de l'ADN génomique de la souche C1847 (Durand, H., M. Clanet, and G. Tiraby. 1988. Genetic improvement of Trichoderma reesei for large scale cellulase production. Enzyme Microb. Technol. 10:341-346.) en utilisant les amorces sens 34-R (SEQ ID N° 34) et antisens 35-F (SEQ ID N° 35).

Les produits de PCR correspondant à SEQ ID N°30 et SEQ ID N° 33 ont ensuite été co-transformés dans une souche T. reesei QM9414 Atku70 - pyr4 (Guangtao, Z., Hartl, L., Schuster, A., Polak, S., Schmoll, M., Wang, T., Seidl, V., et al. (2009). Gene targeting in a nonhomologous end joining déficient Hypocrea jecorina. Journal of biotechnology, 139(2), 146-51. doi: 10.1016/j.jbiotec.2008.10.007).

Les transformants ont été sélectionnés sur milieu minimum sans uridine. Les mutants ont été purifiés à partir des colonies issues de spores individuelles.

L'intégration de la cassette a été confirmée par l'absence d'une amplification de la région de 735 bp situé entre les positions 1 et 735 de SEQ ID N°l : amorce sens- SEQ ID N°36 et amorce antisens SEQ ID N° 37 ;

par l'amplification par PCR des séquences flanquantes de la cassette d'insertion (SEQ ID N°30). La séquence adjacente en amont du site d'insertion a été amplifiée par PCR en utilisant une amorce qui se lie en amont du site d'insertion et une amorce qui se lie en aval du site d'insertion. Le fragment amplifié présente une taille inférieure de 735 paires de base par rapport celui de la souche d'origine (amorce sens- SEQ ID N° 38 et amorce antisens SEQ ID N° 39).

Exemple 10 : Construction d'une cassette de délétion des positions 249 à 495 de SEQ ID N°l Une séquence nucléotide synthétique été dessinée, synthétisée puis a été introduite dans le plasmide pUC19. Cette séquence (SEQ ID N°40) contient :

la séquence de SEQ ID N° 1 avec une délétion des positions 249 à 495 nucléotides ;

une région en amont et en val de la délétion d'environ 1 kb.

Le plasmide pUC19-RUC19-RIM101-del249-495 contenant la séquence synthétique a été utilisé comme matrice pour amplifier la SEQ ID N°40 par PCR en utilisant les amorces sens 31-R (SEQ ID N° 31) et antisens 32-F (SEQ ID N° 32).

La cassette de sélection PYR4 contenant le gène PYR4 avec environ l,2kb en amont du gène et 0.6kb en aval du gène (SEQ ID N° 33) a été amplifiée à partir de l'ADN génomique de la souche C1847 (Durand, H., M. Clanet, and G. Tiraby. 1988. Genetic improvement of Trichoderma reesei for large scale cellulase production. Enzyme Microb. Technol. 10:341-346.) en utilisant les amorces sens 34-R (SEQ ID N° 34) et antisens 35-F (SEQ ID N° 35).

Les produits de PCR correspondant à SEQ ID N°40 et SEQ ID N°33 ont ensuite été co-transformés dans une souche T. reesei QM9414 Atku70 - pyr4 (Guangtao, Z., Hartl, L., Schuster, A., Polak, S., Schmoll, M., Wang, T., Seidl, V., et al. (2009). Gene targeting in a nonhomologous end joining déficient Hypocrea jecorina. Journal of biotechnology, 139(2), 146-51. doi: 10.1016/j.jbiotec.2008.10.007).

Les transformants ont été sélectionnés sur milieu minimum sans uridine. Les mutants ont été purifiés à partir des colonies issues de spores individuelles.

L'intégration de la cassette a été confirmée :

- par l'absence d'une amplification de la région de 246 bp situé entre les positions 249 et 495 de SEQ ID N°l : amorce sens- SEQ ID N°40 et amorce antisens SEQ ID N° 41 ; et

par l'amplification par PCR des séquences flanquantes de la cassette d'insertion (SEQ ID N°30). La séquence adjacente en amont du site d'insertion a été amplifiée par PCR en utilisant une amorce qui se lie en amont du site d'insertion et une amorce qui se lie en aval du site d'insertion. Le fragment amplifié présente une taille inférieure de 246 paires de base par rapport celui de la souche d'origine (amorce sens- SEQ ID N° 38 et amorce antisens SEQ ID N° 39).

Exemple 11 : Construction d'une cassette de délétion des positions 736 à 744 de SEQ ID N°l

Une séquence nucléotide synthétique été dessinée, synthétisée puis a été introduite dans le plasmide pUC19. Cette séquence (SEQ ID N°43) contient :

la séquence de SEQ ID N°l avec une délétion des positions 736 à 744 nucléotides ; et

une région en amont et en val de la délétion d'environ 1 kb. Le plasmide pUC19-RUC19-RIM101-del736-744 contenant la séquence synthétique a été utilisé comme matrice pour amplifier la SEQ ID N°43 par PCR en utilisant les amorces sens 31-R (SEQ ID N° 31) et antisens 32-F (SEQ ID N° 32). La cassette de sélection PYR4 contenant le gène PYR4 avec environ l,2kb en amont du gène et 0.6kb en aval du gène (SEQ ID N°33) a été amplifiée à partir de l'ADN génomique de la souche C1847 (Durand, H., M. Clanet, and G. Tiraby. 1988. Genetic improvement of Trichoderma reesei for large scale cellulase production. Enzyme Microb. Technol. 10:341-346.) en utilisant les amorces sens 34-R (SEQ ID N° 34) et antisens 35-F (SEQ ID N° 35).

Les produits de PCR correspondant à SEQ ID N°43 et SEQ ID N°33 ont ensuite été co-transformés dans une souche T. reesei QM9414 Atku70 - pyr4 (Guangtao, Z., Hartl, L., Schuster, A., Polak, S., Schmoll, M., Wang, T., Seidl, V., et al. (2009). Gene targeting in a nonhomologous end joining déficient Hypocrea jecorina. Journal of biotechnology, 139(2), 146-51. doi: 10.1016/j.jbiotec.2008.10.007). Les transformants ont été sélectionnés sur milieu minimum sans uridine. Les mutants ont été purifiés à partir des colonies issues de spores individuelles.

L'intégration de la cassette a été confirmée :

par l'absence d'une amplification de la région de contenant la délétion 736-744 en utilisant une amorce localisée sur le site de la délétion : amorce sens- SEQ ID N°44 et amorce antisens SEQ ID N° 46 (amorce sur le site de la délétion) ;

par l'amplification par PCR des séquences flanquantes de la cassette d'insertion (SEQ ID N°43). La séquence adjacente en amont du site d'insertion a été amplifiée par PCR en utilisant une amorce qui se lie en amont du site d'insertion et une amorce qui se lie en aval du site d'insertion (amorce sens- SEQ ID N° 38 et amorce antisens SEQ ID N° 39). La présence de la délétion 736-744 est vérifiée par séquençage en utilisant les amorces SEQ ID N° 44 et amorce antisens SEQ ID N° 45. Exemple 12 : Construction d'une cassette de délétion des positions 1438 à 1515 de SEQ ID N°l Une séquence nucléotide synthétique été dessinée, synthétisée puis a été introduite dans le plasmide pUC19. Cette séquence (SEQ ID N°47) contient : la séquence de SEQ ID N°l avec une délétion des positions 1438 à 1515 nucléotides ; et

- une région en amont et en val de la délétion d'environ 1 kb.

Le plasmide pUC19-RUC19-RIM101-del-1438-1515 contenant la séquence synthétique a été utilisé comme matrice pour amplifier la SEQ ID N°47 par PCR en utilisant les amorces sens 48-R (SEQ ID N° 48) et antisens 49-F (SEQ ID N° 49).

La cassette de sélection PYR4 contenant le gène PYR4 avec environ l,2kb en amont du gène et 0.6kb en aval du gène (SEQ ID 33) a été amplifiée à partir de l'ADN génomique de la souche C1847 (Durand, H., M. Clanet, and G. Tiraby. 1988. Genetic improvement of Trichoderma reesei for large scale cellulase production. Enzyme Microb. Technol. 10:341-346.) en utilisant les amorces sens 34-R (SEQ ID N° 34) et antisens 35-F (SEQ ID N° 35).

Les produits de PCR correspondant à SEQ ID N°47 et SEQ ID N°33 ont ensuite été co-transformés dans une souche T. reesei QM9414 Atku70 - pyr4 (Guangtao, Z., Hartl, L., Schuster, A., Polak, S., Schmoll, M., Wang, T., Seidl, V., et al. (2009). Gene targeting in a nonhomologous end joining déficient Hypocrea jecorina. Journal of biotechnology, 139(2), 146-51, doi: 10.1016/j.jbiotec.2008.10.007).

Les transformants ont été sélectionnés sur milieu minimum sans uridine. Les mutants ont été purifiés à partir des colonies issues de spores individuelles. L'intégration de la cassette a été confirmée :

par l'amplification par PCR des séquences flanquantes de la cassette d'insertion (SEQ ID N°47). La séquence adjacente en amont du site d'insertion a été amplifiée par PCR en utilisant une amorce qui se lie en amont du site d'insertion et une amorce qui se lie en aval du site d'insertion (amorce sens- SEQ ID N° 31 et amorce antisens SEQ ID N° 50). La présence de la délétion 1438-1515 est vérifiée par séquençage en utilisant les amorces SEQ ID N° 51 et amorce antisens SEQ ID N° 52 ;

- par l'absence d'une amplification de la région de contenant la délétion

1438 à 1515 en utilisant une amorce localisée sur le site de la délétion : amorce sens- SEQ ID N°44 et amorce antisens SEQ ID N° 53 (dans la délétion). Exemple 13 : Construction d'une cassette de délétion des positions 1492 à 1494 de SEQ ID N°l

Une séquence nucléotide synthétique été dessinée, synthétisée puis a été introduite dans le plasmide pUC19. Cette séquence (SEQ ID N°54) contient :

- la séquence de SEQ ID N°l avec une délétion des positions 1492 à

1494 nucléotides, et

une région en amont et en val de la délétion d'environ 1 kb.

Le plasmide pUC19-RUC19-RIM101-del- 1492- 1494 contenant la séquence synthétique a été utilisé comme matrice pour amplifier la SEQ ID N°54 par PCR en utilisant les amorces sens 48-R (SEQ ID N° 48) et antisens 49-F (SEQ ID N° 49).

La cassette de sélection PYR4 contenant le gène PYR4 avec environ l,2kb en amont du gène et 0.6kb en aval du gène (SEQ ID 33) a été amplifiée à partir de l'ADN génomique de la souche C1847 (Durand, H., M. Clanet, and G. Tiraby. 1988. Genetic improvement of Trichoderma reesei for large scale cellulase production. Enzyme Microb. Technol. 10:341-346.) en utilisant les amorces sens 34-R (SEQ ID N° 34) et antisens 35-F (SEQ ID N° 35). Les produits de PCR correspondant à SEQ ID N°54 et SEQ ID 33 ont ensuite été co-transformés dans une souche T. reesei QM9414 Atku70 - pyr4 (Guangtao, Z., Hartl, L., Schuster, A., Polak, S., Schmoll, M., Wang, T., Seidl, V., et al. (2009). Gene targeting in a nonhomologous end joining déficient Hypocrea jecorina. Journal of biotechnology, 139(2), 146-51. doi: 10.1016/j.jbiotec.2008.10.007).

Les transformants ont été sélectionnés sur milieu minimum sans uridine. Les mutants ont été purifiés à partir des colonies issues de spores individuelles.

L'intégration de la cassette a été confirmée par l'amplification par PCR des séquences flanquantes de la cassette d'insertion (SEQ ID N°54). La séquence adjacente en amont du site d'insertion a été amplifiée par PCR en utilisant une amorce qui se lie en amont du site d'insertion et une amorce qui se lie en aval du site d'insertion (amorce sens- SEQ ID N° 31 et amorce antisens SEQ ID N° 50). La présence de la délétion 1492-1494 est vérifiée par séquençage en utilisant les amorces SEQ ID N° 51 et amorce antisens SEQ ID N° 52.