CN101321777A - 丝蛋白 - Google Patents

丝蛋白 Download PDF

Info

Publication number
CN101321777A
CN101321777A CNA2006800456662A CN200680045666A CN101321777A CN 101321777 A CN101321777 A CN 101321777A CN A2006800456662 A CNA2006800456662 A CN A2006800456662A CN 200680045666 A CN200680045666 A CN 200680045666A CN 101321777 A CN101321777 A CN 101321777A
Authority
CN
China
Prior art keywords
ala
seq
ser
glu
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800456662A
Other languages
English (en)
Other versions
CN101321777B (zh
Inventor
T·D·萨瑟兰
V·S·哈里托斯
H·特鲁曼
A·斯里斯坎瑟
S·韦斯曼
P·M·坎贝尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Commonwealth Scientific and Industrial Research Organization CSIRO
Original Assignee
Commonwealth Scientific and Industrial Research Organization CSIRO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Commonwealth Scientific and Industrial Research Organization CSIRO filed Critical Commonwealth Scientific and Industrial Research Organization CSIRO
Publication of CN101321777A publication Critical patent/CN101321777A/zh
Application granted granted Critical
Publication of CN101321777B publication Critical patent/CN101321777B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • C07K14/43572Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from bees
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/30Macromolecular organic or inorganic compounds, e.g. inorganic polyphosphates
    • A61K47/42Proteins; Polypeptides; Degradation products thereof; Derivatives thereof, e.g. albumin, gelatin or zein
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/02Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/73Fusion polypeptide containing domain for protein-protein interaction containing coiled-coiled motif (leucine zippers)

Abstract

本发明提供丝蛋白,以及编码这些蛋白的核酸。本发明也提供合成丝蛋白的重组细胞和/或有机体。本发明的丝蛋白可有多种用途,如用于生产个人护理产品、塑料制品、纺织品和生物医学产品。

Description

丝蛋白
发明领域
本发明涉及丝蛋白,以及编码此类蛋白的核酸。本发明也涉及合成丝蛋白的重组细胞和/或有机体。本发明的丝蛋白可有多种用途,如用于生产个人护理产品、塑料制品、纺织品和生物医学产品。
发明背景
丝是表现出特别强度和韧性的纤维状蛋白质分泌物,因此是广泛研究的对象。超过30,000种蜘蛛和许多昆虫产丝。其中很少得到性质描述,而大部分研究集中在家蚕(Bombyx mori)的茧丝和织网蜘蛛棒络新妇蛛(Nephila clavipes)的拖丝上。
在鳞翅目和蜘蛛中,丝心蛋白基因编码的蛋白一般很大,在两个末端都有显著的亲水末端结构域,其间跨过疏水块和亲水块交替出现的大范围的区域(Bini等人,2004)。这些蛋白一般包括与β折叠、β螺旋(β-spirals)、α螺旋和无定形区松散关联的β折叠层的晶列(crystalline arrays)的不同组合(见Craig和Riekel,2002年综述)。
由于丝纤维代表了一些已知最强的自然纤维,人们对其进行了广泛的研究,以期能重现其合成过程。然而,由于丝基因中存在重复核苷酸基序(motifs),它们会导致有害重组事件发生,而且丝基因很大,基因中每个氨基酸使用少数密码子导致宿主细胞tRNA库耗尽,上述因素的组合使得在许多不同重组表达系统中表达鳞翅目和蜘蛛丝心蛋白基因时,经常出现低表达率的问题。重组表达会导致翻译过程中的困难,如由于密码子偏爱和密码子需求而导致翻译中止,以及由于高重组率导致基因截断。至今为止,较短和较少的重复序列可以避免许多与丝基因表达有关的问题。
与对鳞翅目(特别是家蚕的茧丝)和蜘蛛(特别是棒络新妇蛛的拖丝)所积累的广泛知识相比,人们对其它昆虫丝的化学组成和分子组织所知甚少。
在20世纪60年代早期,对蜜蜂幼虫唾液腺丝纤维的X射线衍射图谱分析表明针尾类膜翅目昆虫的丝具有α-螺旋结构(Rudall,1962)。同时证明该丝是螺旋的,获得的图谱显示了α-螺旋链的卷曲螺旋(coiled-coil)系统(Atkins,1967)。来源于其它针尾类物种包括黄蜂(wasp),虎头蜂(Pseudopompilus humbolti)(Rudall,1962)和熊蜂(bumblebee),明亮熊蜂(Bombus lucorum)(Lucas和Rudall,1967)的茧丝显示出相似的X射线衍射图谱。
与针尾类丝中α-螺旋结构形成对比的是,与针尾类相关的进化枝上的姬蜂总科(Ichneumonoidea)的丝的特点是具有平行-β结构。人们已经对具有这种结构的茧蜂科四例(粉蝶盘绒茧蜂,Cotesia(=Apenteles)glomerate ;Cotesia(=Apenteles)gonopterygis;Apenteles hignelli)和姬蜂科三例(Dusona sp.;Phytodietris sp.;Branchus femoralis)的X射线衍射图谱进行了描述(Lucas和Rudall,1967)。此外已经对一个茧蜂科(粉蝶盘绒茧蜂(Cotesia glomerate))丝的序列进行了描述(Genbank数据库登录号为AB 188680;Yamada等人,2004)。这一部分的蛋白序列包括一个高度保守的28X-天冬酰胺重复(其中X为丙氨酸或丝氨酸),并未预测到含有形成卷曲螺旋的七肽重复(heptad repeats)。对茧蜂科茧丝氨基酸组成的广泛分析表明小腹茧蜂亚科的丝具有高天冬酰胺和丝氨酸成分而与其它丝不同(Lucas等人,1960;Quicke等人,2004)。相关亚科产生具有显著不同氨基酸组成的丝表明小腹茧蜂亚科在其亚科内是特异进化的(Yamada等人,2004)。使用根据分离茧丝蛋白内部肽序列设计的PCR引物分离了粉蝶盘绒茧蜂的部分cDNA序列。根据这一部分序列预测的氨基酸组成和来源于该种的广泛水洗丝(extensively washed silk)氨基酸组成十分相似。
其它非针尾类细蜂亚目和其余的膜翅目昆虫(广腰亚目)的丝是十分普通的平行-β折叠,叶蜂科产生类胶原和多聚甘氨酸两种丝(Lucas和Rudall,1967)。
蜜蜂丝蛋白在末龄幼虫中期合成,可视为解聚丝蛋白的混合(Silva-Zacarin等人,2003)。随着龄期的进行,腺体中的水被去除,脱水导致丝蛋白聚合形成组织有序的丝标记的类晶团聚体(Silva-Zacarin等人,2003)。进行性脱水导致类晶团聚体进一步重组织(Silva-Zacarin等人,2003)并可能在丝间形成新的丝间结合(Rudall,1962)。从蜜蜂丝腺分离的原纤维电镜图片显示直径约20-25埃的结构(Flower和Kenchington,1967)。这一数值与3-、4-、5-股卷曲螺旋(coiled coil)一致。
Lucas和Rudall确定了不同针尾类膜翅目种的丝的氨基酸组成(1967),发现与经典丝心蛋白相比其包括高含量的丙氨酸、丝氨酸、酸性残基、天冬氨酸、谷氨酸,以及低含量的甘氨酸。针尾类膜翅目昆虫的丝的螺旋结构被认为是由于低甘氨酸含量和高酸性残基含量的结果(Rudall和Kenchington,1971)。
人们对于草蜻蛉(lacewing,也称草蛉、草蛉虫)(目:脉翅目)幼虫的丝所知甚少。其茧包括两层,一个内层固体层和一个外层纤维层。以前该茧被描述为包括壳脂蛋白丝(Rudall和Kenchington,1971),这一描述仅与内层固体层有关。LaMunyon(1988)描述了一种构成外层纤维的马氏管分泌的物质。这一层沉积之后,有大量绒毛的内腔表皮细胞的分泌物构成固体内壁(LaMunyon,1988)。
同样已知的是草蜻蛉幼虫所有龄期都从马氏管产生蛋白质粘性物质将幼虫粘到基质上,将伪装物粘到背上或使猎物陷入(Speilger,1962)。Lomamyia(Bethothidae)属的幼虫同时产生丝和粘性物质,人们推定这它们很可能是相同物质(Speilger,1962)。该粘性分泌物是高度可溶的,也被认为与抵抗捕食者的防卫有关(LaMunyon&Adams,1987)。
考虑到诸如膜翅目和脉翅目昆虫所产生丝的独特属性,有必要从这些生物中鉴定新的编码丝蛋白的氨基酸。
发明概述
本发明已从昆虫中鉴定出数目众多的丝蛋白。这些丝蛋白与其它已知丝蛋白在一级序列、二级结构和/或氨基酸含量方面有惊人的差异。
因此,本发明第一方面提供一种基本上纯化的和/或重组的丝多肽,其中至少该丝多肽的一部分具有卷曲螺旋结构。
现有技术已知多肽的卷曲螺旋结构具有特征性七肽重复序列,以共有序列(abcdefg)n表示,其中a和d位一般为疏水残基,其余位置一般为极性残基。令人吃惊的是,本发明多肽的七肽总体看来具有新颖的组成——在疏水七肽位置a和d位异乎寻常地富含丙氨酸。此外,在这些位置含有高水平的小的极性残基。更进一步而言,e位也有高水平的丙氨酸和小的疏水残基。
相应地,在一个特别优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg,并且至少25%的a和d位氨基酸是丙氨酸残基。
在另一个优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg,并且至少25%的a、d和e位氨基酸是丙氨酸残基。
在另一个优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg,并且至少25%的a位氨基酸是丙氨酸残基。
在另一个优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg,并且至少25%的d位氨基酸是丙氨酸残基。
在另一个优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg,并且至少25%的e位氨基酸是丙氨酸残基。
在一个特别优选实施方式中,所述的至少10拷贝的七肽序列是连续的。
在另一个优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg,并且至少15%的a和d位氨基酸是丙氨酸残基。
在另一个优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg,并且至少15%的a、d和e位氨基酸是丙氨酸残基。
在另一个优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg,并且至少15%的a氨基酸是丙氨酸残基。
在另一个优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg,并且至少15%的d位氨基酸是丙氨酸残基。
在另一个优选实施方式中,具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg,并且至少15%的e位氨基酸是丙氨酸残基。
在一个特别优选实施方式中,所述的至少5拷贝的七肽序列是连续的。
在一个实施方式中,所述的多肽包括选自下述的序列:
i)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:56以及SEQ ID NO:57所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:56以及SEQ ID NO:57中任何一条或多条具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
在另外一个实施方式中,所述的多肽包括选自下述的序列:
i)SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:58以及SEQ ID NO:59所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:58以及SEQ ID NO:59中任何一条或多条具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
在另外一个实施方式中,所述的多肽包括选自下述的序列:
i)SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:60以及SEQ ID NO:61所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:60以及SEQ ID NO:61中任何一条或多条具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
在另外一个实施方式中,所述的多肽包括选自下述的序列:
i)SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:46、SEQ ID NO:47、SEQ ID NO:62以及SEQ ID NO:63所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:46、SEQ ID NO:47、SEQ ID NO:62以及SEQ ID NO:63中任何一条或多条具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
在另外一个实施方式中,所述的多肽包括选自下述的序列:
i)SEQ ID NO:72或SEQ ID NO:73所提供的氨基酸序列;
ii)与SEQ ID NO:72和/或SEQ ID NO:73具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
与本发明第一方面有关的更多丝蛋白已得到鉴定。这些蛋白其中之一(SEQ IDNO:10)被PROFsec预测为含有41%的α螺旋、8%的β折叠和50%的环的二级结构,因而被归入混合结构蛋白一类。对该蛋白的MARCOIL分析仅预测出一个短的七肽重复区,这是具有卷曲螺旋结构蛋白的特征性结构。
相应地,本发明第二方面提供一种基本上纯化的和/或重组的丝多肽,其包括选自下述的序列:
i)SEQ ID NO:9、SEQ ID NO:10以及SEQ ID NO:30所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:9、SEQ ID NO:10以及SEQ ID NO:30具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
若不被理论所限,似乎第一方面的四种蛋白质的螺旋轴相互平行地缠绕形成束,这些束沿轴向延长形成原纤维。此外,据预测至少在象蜜蜂和熊蜂这样的物种中,第二方面的蛋白起“胶”的作用,辅助将许多第一方面的卷曲螺旋蛋白束粘合在一起形成纤维蛋白复合体。然而,即使没有第二方面的多肽,仍然可以形成丝纤维和共聚物。
在一个优选实施方式中,本发明的多肽可从膜翅目或脉翅目昆虫的物种中纯化获得,或是纯化获得的多肽的突变体。优选地,膜翅目昆虫的物种为意大利蜂(Apis mellifera)、黄猄蚁(Oecophylla smaragdina)、牛头犬蚁(Myrmecia foricata)或授粉熊蜂(Bombus terrestris)。优选地,脉翅目昆虫的物种为玛草蛉(Malladasignata)。
另一方面,本发明提供本发明多肽与至少一种其他多肽融合。
在一个优选的实施方式中,所述的至少一种其他多肽选自:提高本发明多肽稳定性的多肽、辅助所述的融合蛋白纯化的多肽或辅助本发明的多肽从细胞中分泌的多肽(例如从植物细胞中分泌)。
另一方面,本发明提供编码丝多肽的分离的和/或外源多核苷酸,其中该丝多肽至少一部分具有卷曲螺旋结构。
在一个实施方式中,所述的多核苷酸包括选自下述的序列:
i)SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:31、SEQ ID NO:32、SEQ IDNO:48、SEQ ID NO:49、SEQ ID NO:64以及SEQ ID NO:65所提供的任何一条核苷酸序列;
ii)编码本发明多肽的核苷酸序列,
iii)与SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:31、SEQ ID NO:32、SEQID NO:48、SEQ ID NO:49、SEQ ID NO:64以及SEQ ID NO:65中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
在另一个实施方式中,所述的多核苷酸包括选自下述的序列:
i)SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:66以及SEQ ID NO:67所提供的任何一条核苷酸序列;
ii)编码本发明多肽的核苷酸序列,
iii)与SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:33、SEQ ID NO:34、SEQID NO:50、SEQ ID NO:51、SEQ ID NO:66以及SEQ ID NO:67中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
在另外一个实施方式中,所述的多核苷酸包括选自下述的序列:
i)SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:52、SEQ ID NO:53、SEQ ID NO:68以及SEQ ID NO:69所提供的任何一条核苷酸序列;
ii)编码本发明多肽的核苷酸序列,
iii)与SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:35、SEQ ID NO:36、SEQID NO:52、SEQ ID NO:53、SEQ ID NO:68以及SEQ ID NO:69中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
在另一个实施方式中,所述的多核苷酸包括选自下述的序列:
i)SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:37、SEQ ID NO:38、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:70、SEQ ID NO:71以及SEQ ID NO:76所提供的任何一条核苷酸序列;
ii)编码本发明多肽的核苷酸序列,
iii)与SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:37、SEQ ID NO:38、SEQID NO:54、SEQ ID NO:55、SEQ ID NO:70、SEQ ID NO:71以及SEQ ID NO:76中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
在另一个实施方式中,所述的多核苷酸包括选自下述的序列:
i)SEQ ID NO:74或SEQ ID NO:75所提供的核苷酸序列;
ii)编码本发明多肽的核苷酸序列,
iii)与SEQ ID NO:74和/或SEQ ID NO:75具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
另一方面,本发明提供分离的和/或外源多核苷酸,该多核苷酸包括选自下述的序列:
i)SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21以及SEQ ID NO:39所提供的任何一条核苷酸序列;
ii)编码本发明多肽的核苷酸序列,
iii)与SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21以及SEQ ID NO:39中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
在一个优选实施方式中,本发明的多核苷酸可从膜翅目或脉翅目昆虫的物种中分离获得,或是分离获得的多核苷酸的突变体。优选地,膜翅目昆虫的物种为意大利蜂(Apis mellifera)、黄猄蚁(Oecophylla smaragdina)、牛头犬蚁(Myrmeciaforicata)或授粉熊蜂(Bombus terrestris)。优选地,脉翅目昆虫的物种为玛草蛉(Mallada signata)。
另一方面,本发明提供包括至少一种本发明多核苷酸的载体。
优选地,该载体为表达载体。
另一方面,本发明提供包括至少一种本发明多核苷酸和/或至少一种本发明载体的宿主细胞。
该宿主细胞可为任何类型的细胞,其例子包括但不限于细菌、酵母或植物细胞。
本发明也提供制备本发明多肽的方法,该方法包括在允许编码所述多肽的多核苷酸表达条件下,培养本发明的宿主细胞,或本发明的载体,以及回收所表达的多肽。
可想而知转基因植物在生产本发明多肽中特别有用。因此,另一方面,本发明提供包括包括外源多核苷酸,编码至少一种本发明的多肽的转基因植物。
另一方面,本发明提供包括外源多核苷酸,编码至少一种本发明的多肽的非人类转基因动物。
另一方面,本发明提供特异性结合本发明多肽的抗体。
另一方面,本发明提供包括至少一种本发明多肽的丝纤维。
优选地,该多肽是一种重组多肽。
在一个实施方式中,至少一些所述的多肽是交联的。在一个实施方式中,至少所述的多肽的一些赖氨酸残基是交联的。
另一方面,本发明提供包括至少两种本发明多肽的共聚物。
优选地,所述的多肽是重组多肽。
在一个实施方式中,所述的共聚物包括至少四种不同的第一方面的多肽。在另一个实施方式中,所述的共聚物进一步包括一种第二方面的多肽。
在一个实施方式中,至少一些所述的多肽是交联的。在一个实施方式中,至少所述的多肽的一些赖氨酸残基是交联的。
本领域技术人员会理解本发明多肽具有如所属领域其它类型丝蛋白一样具有广泛的已知的用途。因此,另一方面,本发明提供包括至少一种本发明多肽,本发明丝纤维和/或本发明共聚物的产品。
产品的例子包括但不限于个人护理产品、纺织品、塑料制品和生物医学产品。
另一方面,本发明提供包括至少一种本发明多肽、本发明丝纤维和/或本发明共聚物,以及一种或一种以上可接受的载体的组合物。
在一个实施方式中,所述的组合物进一步包括药物。
在另一个实施方式中,所述的组合物用作药物、或者在医疗器械或化妆品中使用。
另一方面,本发明提供包括至少一种本发明多核苷酸,以及一种或一种以上可接受的载体的组合物。
在一个优选实施方式中,本发明的组合物、丝纤维、共聚物和/或产品不包括昆虫产生的王浆蛋白。
另一方面,本发明提供一种治疗或预防疾病的方法,该方法包括给予包括治疗或预防该疾病的药物和药用载体的组合物,其中药用载体选自至少一种本发明多肽、本发明丝纤维和/或本发明共聚物。
另一方面,本发明提供至少一种本发明多肽、本发明丝纤维和/或本发明共聚物,以及药物,在制备治疗或预防疾病的药物中的用途。
另一方面,本发明提供包括至少一种本发明多肽、至少一种本发明多核苷酸、至少一种本发明载体、至少一种本发明丝纤维和/或本发明共聚物的试剂盒。
优选地,所述的试剂盒进一步包括使用该试剂盒的信息和/或说明。
很明显,本发明一个方面的优选特征和特性也可用于本发明其他许多方面。
整个说明书中所用的词语“包括(comprise)”或其变体“包括(comprises)”或“包括(comprising)”,应理解为是指含有所述的成分、整体或步骤,或成分、整体或步骤组成的组,但不排除任何其他成分、整体或步骤,或成分、整体或步骤组成的组。
下文中本发明通过下述非限定实施例并对附图附有参考的方式进行描述。
附图说明
图1.下列丝的酰胺I区和II区的傅立叶变换红外光谱:1)蜜蜂丝,2)熊蜂丝,3)牛头犬蚁(bulldog ant)丝,4)织工蚁(weaver ant)丝,5)草蜻蛉(lacewing)幼虫丝。上述所有的丝都具有光谱预期的螺旋蛋白。膜翅目昆虫的丝(蚂蚁和蜜蜂)在1645-1646cm-1具有光谱最大值(标记的),比典型α螺旋低,移动10cm-1并变宽,这是典型的卷曲螺旋蛋白的特征(Heimburg等人,1999)。
图2.SDS洗涤过的蜜蜂巢房(brood comb)丝氨基酸组成与Xenospira蛋白(即,Xenospira 1、Xenospira 2、Xenospira 3、Xenospira 4)(等摩尔数总计65%)及Xenosin氨基酸(35%)组成的比较。
图3.丝氨基酸组成与丝基因编码蛋白预测的氨基酸组成的比较。
图4.蜜蜂丝蛋白卷曲螺旋区的预测。COILS是将一个序列与已知平行双股卷曲螺旋数据库比较的程序,并取得相似性得分。通过将该得分与球形和卷曲螺旋蛋白得分的分布相比较,程序计算该序列采取卷曲螺旋构象的概率,如Lupas等人所述(1991)。使用窗口大小28,本程序预测下列每个蛋白的卷曲螺旋结构域中存在下述残基数目:Xenospira 3:77;Xenospira 4:35;Xenospira 1:28;Xenospira2:80。
图5.蜜蜂丝蛋白比对显示形成卷曲螺旋的主要七肽的MARCOIL预测结果。七肽序列显示在氨基酸上面,a位和d位的丙氨酸残基突出显示。
图6.Marciol预测的膜翅目昆虫(蜜蜂和蚂蚁)丝蛋白卷曲螺旋区比对显示七肽位置分配。Amel,蜜蜂;BB,熊蜂;BA,牛头犬蚁;WA,织工蚁;F1-4,丝心蛋白1-4。七肽序列显示在氨基酸上面,a位、d位和e位的丙氨酸残基突出显示。
图7.玛草蛉(Mallada signata)幼虫丝蛋白和膜翅目昆虫丝蛋白直系同源簇(orthologous clusters)的预测的卷曲螺旋区中七肽位置的氨基酸特征。
图8.晚末龄幼虫唾液腺蛋白的SDS聚丙烯酰胺凝胶电泳。在胰蛋白酶切后分析质谱数据组对蛋白进行鉴定。通过安捷伦公司Spectrum Mill软件将质谱数据与从cDNA序列确定蛋白的预测蛋白序列相匹配,从而得到质谱分析结果。该软件对实验观察到的肽片段数据组与根据已有数据库中蛋白序列产生的可能的预测片段之间的每个匹配的质量给出得分。此处显示的所有序列匹配的Spectrum Mill软件得分都大于20,而20的得分足以自动的有把握的认定一个有效的匹配。
图9.丝蛋白卷曲螺旋区简约性分析。四个卷曲螺旋蛋白的相关性暗示该基因在真针尾类(Euaculeata)分化之前从共同的祖先进化而来。虚线包围的区域显示在侏罗纪晚期蚂蚁和蜜蜂(胡蜂总科)从蜜蜂(蜜蜂总科)分化之前所出现的变异(155myrs(百万年);Grimaldi和Engel,2005)。图中给出了做1000次重复抽样(iterations)之后,每个分支的自信自展值(bootstrap values)。
图10.A)对蜜蜂丝胰蛋白酶切产生的肽进行质谱分析,鉴定蜜蜂丝蛋白。阴影表示质谱分析鉴定的肽。此处显示的所有序列匹配的Spectrum Mill软件得分都大于20,而20的得分足以自动的有把握的认定一个有效的匹配。
B)熊蜂、牛头犬蚁、织工蚁和草蜻蛉丝蛋白全长氨基酸序列。
图11.编码蜜蜂、熊蜂、牛头犬蚁、织工蚁和草蜻蛉丝蛋白的开放读码框(Openreading frames)。
图12.编码Xenosin的基因序列。提供了完整编码序列,其中插入了一个内含子(突出显示处)。
图13.丝蛋白在烟草中的表达。对下列来源的蛋白进行蛋白印迹分析(westernblot analysis),检测带组氨酸标签的蛋白:1.空表达载体转化的大肠杆菌(E.coli),2.包括AmelF4(Xenospira4)编码区的表达载体转化的大肠杆菌(E.coli),3.空表达载体转化的烟草,4.包括AmelF4编码区的表达载体转化的烟草。
图14.重组蜜蜂丝蛋白制成的纤维表现出双折射线。生物折射表明线中存在结构。A-D每组显示了不同的重组蜜蜂的线,E组中显示了重组的草蜻蛉的线。
序列表索引
SEQ ID NO:1-此处称为Xenospiral的蜜蜂丝蛋白(也称为AmelF1)(减去信号肽)。
SEQ ID NO:2-此处称为Xenospiral的蜜蜂丝蛋白。
SEQ ID NO:3-此处称为Xenospira2的蜜蜂丝蛋白(也称为AmelF2)(减去信号肽)。
SEQ ID NO:4-此处称为Xenospira2的蜜蜂丝蛋白。
SEQ ID NO:5-此处称为Xenospira3的蜜蜂丝蛋白(也称为AmelF3)(减去信号肽)。
SEQ ID NO:6-此处称为Xenospira3的蜜蜂丝蛋白。
SEQ ID NO:7-此处称为Xenospira4的蜜蜂丝蛋白(也称为AmelF4)(减去信号肽)。
SEQ ID NO:8-此处称为Xenospira4的蜜蜂丝蛋白。
SEQ ID NO:9-此处称为Xenosin的蜜蜂丝蛋白(也称为AmelSA1)(减去信号肽)。
SEQ ID NO:10-此处称为Xenosin的蜜蜂丝蛋白。
SEQ ID NO:11-编码蜜蜂丝蛋白Xenospira1的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:12-编码蜜蜂丝蛋白Xenospira1的核苷酸序列。
SEQ ID NO:13-编码蜜蜂丝蛋白Xenospira2的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:14-编码蜜蜂丝蛋白Xenospira2的核苷酸序列。
SEQ ID NO:15-编码蜜蜂丝蛋白Xenospira3的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:16-编码蜜蜂丝蛋白Xenospira3的核苷酸序列。
SEQ ID NO:17-编码蜜蜂丝蛋白Xenospira4的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:18-编码蜜蜂丝蛋白Xenospira4的核苷酸序列。
SEQ ID NO:19-编码蜜蜂丝蛋白Xenosin的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:20-编码蜜蜂丝蛋白Xenosin的核苷酸序列。
SEQ ID NO:21-编码蜜蜂丝蛋白Xenosin的基因序列。
SEQ ID NO:22-此处称为BBF1的熊蜂丝蛋白(减去信号肽)。
SEQ ID NO:23-此处称为BBF1的熊蜂丝蛋白。
SEQ ID NO:24-此处称为BBF2的熊蜂丝蛋白(减去信号肽)。
SEQ ID NO:25-此处称为BBF2的熊蜂丝蛋白。
SEQ ID NO:26-此处称为BBF3的熊蜂丝蛋白(减去信号肽)。
SEQ ID NO:27-此处称为BBF3的熊蜂丝蛋白。
SEQ ID NO:28-此处称为BBF4的熊蜂丝蛋白(减去信号肽)。
SEQ ID NO:29-此处称为BBF4的熊蜂丝蛋白。
SEQ ID NO:30-此处称为BBSA1的熊蜂丝蛋白部分氨基酸序列。
SEQ ID NO:31-编码熊蜂丝蛋白BBF1的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:32-编码熊蜂丝蛋白BBF1的核苷酸序列。
SEQ ID NO:33-编码熊蜂丝蛋白BBF2的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:34-编码熊蜂丝蛋白BBF2的核苷酸序列。
SEQ ID NO:35-编码熊蜂丝蛋白BBF3的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:36-编码熊蜂丝蛋白BBF3的核苷酸序列。
SEQ ID NO:37-编码熊蜂丝蛋白BBF4的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:38-编码熊蜂丝蛋白BBF4的核苷酸序列。
SEQ ID NO:39-编码熊蜂丝蛋白BBSA1的部分核苷酸序列。
SEQ ID NO:40-此处称为BAF1的牛头犬蚁丝蛋白(减去信号肽)。
SEQ ID NO:41-此处称为BAF1的牛头犬蚁丝蛋白。
SEQ ID NO:42-此处称为BAF2的牛头犬蚁丝蛋白(减去信号肽)。
SEQ ID NO:43-此处称为BAF2的牛头犬蚁丝蛋白。
SEQ ID NO:44-此处称为BAF3的牛头犬蚁丝蛋白(减去信号肽)。
SEQ ID NO:45-此处称为BAF3的牛头犬蚁丝蛋白。
SEQ ID NO:46-此处称为BAF4的牛头犬蚁丝蛋白(减去信号肽)。
SEQ ID NO:47-此处称为BAF4的牛头犬蚁丝蛋白。
SEQ ID NO:48-编码牛头犬蚁丝蛋白BAF1的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:49-编码牛头犬蚁丝蛋白BAF1的核苷酸序列。
SEQ ID NO:50-编码牛头犬蚁丝蛋白BAF2的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:51-编码牛头犬蚁丝蛋白BAF2的核苷酸序列。
SEQ ID NO:52-编码牛头犬蚁丝蛋白BAF3的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:53-编码牛头犬蚁丝蛋白BAF3的核苷酸序列。
SEQ ID NO:54-编码牛头犬蚁丝蛋白BAF4的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:55-编码牛头犬蚁丝蛋白BAF4的核苷酸序列。
SEQ ID NO:56-此处称为GAF1的织工蚁丝蛋白(减去信号肽)。
SEQ ID NO:57-此处称为GAF1的织工蚁丝蛋白。
SEQ ID NO:58-此处称为GAF2的织工蚁丝蛋白(减去信号肽)。
SEQ ID NO:59-此处称为GAF2的织工蚁丝蛋白。
SEQ ID NO:60-此处称为GAF3的织工蚁丝蛋白(减去信号肽)。
SEQ ID NO:61-此处称为GAF3的织工蚁丝蛋白。
SEQ ID NO:62-此处称为GAF4的织工蚁丝蛋白(减去信号肽)。
SEQ ID NO:63-此处称为GAF4的织工蚁丝蛋白。
SEQ ID NO:64-编码织工蚁丝蛋白GAF1的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:65-编码织工蚁丝蛋白GAF1的核苷酸序列。
SEQ ID NO:66-编码织工蚁丝蛋白GAF2的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:67-编码织工蚁丝蛋白GAF2的核苷酸序列。
SEQ ID NO:68-编码织工蚁丝蛋白GAF3的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:69-编码织工蚁丝蛋白GAF3的核苷酸序列。
SEQ ID NO:70-编码织工蚁丝蛋白GAF4的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:71-编码织工蚁丝蛋白GAF4的核苷酸序列。
SEQ ID NO:72-此处称为MalF1的草蜻蛉丝蛋白(减去信号肽)。
SEQ ID NO:73-此处称为MalF1的草蜻蛉丝蛋白。
SEQ ID NO:74-编码草蜻蛉丝蛋白MalF1的核苷酸序列(减去编码信号肽的区)。
SEQ ID NO:75-编码草蜻蛉丝蛋白MalF1的核苷酸序列。
SEQ ID NO:76-对密码子为植物表达而进行优化(在亚克隆到pET14b和pVEC8之前)的编码此处称为Xenospira4蜜蜂丝蛋白核苷酸序列。
SEQ ID NO:77-为植物表达而进行优化的蜜蜂丝蛋白(Xenospira4)开放读码框(无翻译融合)。
发明内容
普通技术和定义
除非另有特别定义,此处使用的所有科技术语应与本领域(例如细胞培养、分子遗传学、免疫学、免疫组化、蛋白质化学和生物化学领域)普通技术人员通常理解的意思相同。
除非另有说明,本发明使用的重组蛋白、细胞培养和免疫技术采用标准操作,是本领域技术人员熟知的。这些技术在下列文献中有描述和解释,如:J.Perbal,A Practical Guide to Molecular Cloning(实用分子克隆指南),John Wiley和Sons(1984)、J.Sambrook等人,Molecular Cloning:ALaboratory Manual(分子克隆:实验指南),Cold Spring Harbour Laboratory Press(1989)、T.A.Brown(编辑),Essential Molecular Biology:A Practical Approach(基本分子生物学:实用方法),第1和第2卷,IRL Press(1991)、D.M.Glover和B.D.Hames(编辑),DNA Cloning:A Practical Approach(DNA克隆:实用方法),1-4卷,IRL Press(1995和1996)以及F.M.Ausubel等人(编辑),Current Protocols in Molecular Biology(现代分子生物学实验方案),Greene Pub.Associates和Wiley-Interscience(1988,包括至今所有的更新)、Ed Harlow和David Lane(编辑),Antibodies:A Laboratory Manual(抗体:实验指南),Cold Spring Harbour Laboratory(1988)和J.E.Coligan等人(编辑)Current Protocols in Immunology(现代免疫学实验方案),John Wiley&Sons(包括至今所有的更新),这些文献通过引用合并于此。
此处所用的术语“丝蛋白”和“丝多肽”是指能用来生产丝纤维和/或纤维状蛋白复合体的纤维状蛋白质/多肽。自然存在的丝蛋白诸如蜜蜂等昆虫的巢房(brood comb)丝是本发明的一部分,然而,如此处所述,如果在合适的昆虫中表达,可执行同样功能的这些蛋白质的变体很容易生产出来。
此处所用的“丝纤维”是指包括本发明蛋白质可被织成不同物品如纺织品的丝。
此处所用的“共聚物”是指包括两种或两种以上本发明丝蛋白的组合物。该术语不包括自然存在的如昆虫巢房之类的共聚物。
术语“植物”包括整个植物、营养结构(例如叶、茎)、根、花器官/结构、种子(包括胚、胚乳和种皮)、植物组织(例如维管组织、基本组织之类)、细胞以及同类的子代。
“转基因植物”是指包括未在同种、变种或栽培品种的野生型植物中发现的基因构建物(“转基因”)的植物。此处所指“转基因”与生物技术领域正常的意思相同,包括通过重组DNA或RNA技术产生的或改变的基因序列,并被引入植物细胞。转基因可包括从植物细胞中获得的序列。典型地,该转基因通过诸如转化之类的人工操作引入植物中,但是该操作可以是任何所属领域技术人员认可的方法。
“多核苷酸”是指寡核苷酸、核酸分子或其任何片段。可以是基因组来源或合成的DNA或RNA,可以是双链或单链的,可以结合糖类、脂质、蛋白质或其他材料来行使此处限定的特定功能。
此处所用的“可操作的连接”是指两个或两个以上的核酸(例如DNA)片段之间的功能关系。典型地,是指转录调节元件对所转录的序列之间的功能关系。例如,如果启动子在适当的宿主细胞中促进或调节编码序列的转录,则启动子与编码序列之间是可操作的连接,该编码序列可以是如此处所限定的多核苷酸之类的序列。一般而言,可操作的连接到转录序列的启动子转录调节元件与所转录的序列是实体上连续的,即它们是顺式作用(cis-acting)。然而,有些转录调节元件,如增强子,不必与它们所增强转录的编码序列在实体上连续或位于其附近。
术语“信号肽”是指成熟的分泌蛋白质之前的氨基术端多肽。信号肽从蛋白质中切除,因而并不出现在成熟蛋白质中。信号肽具有指导和反式定位(trans-locating)分泌蛋白质穿过细胞膜的功能。信号肽也称为信号序列。
此处所用的“转化”是指细胞通过包括新的多核苷酸而获得新的基因。
此处所用术语“药物”是指能被用来治疗或预防特定疾病的任何化合物,可通过本发明的丝蛋白制成的药物的例子包括但不限于蛋白质、核酸、抗肿瘤试剂、镇痛药、抗生素、抗炎化合物(类固醇类和非类固醇类都包括)、激素、疫苗、标记物质等等。
多肽
本发明所述“基本上纯化的多肽”意思是指一般的从脂质、核酸、其他多肽和其他污染分子诸如天然状态下结合的蜡中分离的多肽。所述的基本上纯化的多肽优选地至少60%的游离,更优选地至少75%的游离,更优选地至少90%的游离于其天然结合的其他成分,上述限定不包括本发明的其他蛋白。
在多肽的背景中使用的术语“重组”是指细胞或无细胞表达系统中,与其天然状态相比,通过改变产量或产率而产生多肽。在一个实施方式中,所述的细胞是天然不产生该多肽的细胞。然而,所述的细胞可以是包括导致该多肽产量改变,优选地为增加该多肽产量的非内源基因的细胞。本发明的重组多肽包括尚未从产生它的转基因(重组)细胞或无细胞表达系统的其他成分中分离出来的多肽,以及在上述细胞或无细胞系统中产生而后从至少一些其他成分中纯化出来的多肽。
术语“多肽”和“蛋白质”一般可相互替换的使用,是指单多肽链,其可能通过添加非氨基酸基团而修饰,也可能不修饰。此处所用的术语“蛋白质”和“多肽”也包括此处所述的本发明的多肽的变异体、突变体、修饰物、模拟物和/或衍生物。
多肽的%同源性(也称同一性,identity)通过GAP(Needleman和Wunsch,1970)分析(GCG程序)确定,其缺口产生罚分(gap creation penalty)=5,缺口延伸罚分(gap extension penalty)=0.3。查询序列至少15个氨基酸长,GAP分析在至少15个氨基酸的区域比对两条序列。更优选地,查询序列至少50个氨基酸长,GAP分析在至少50个氨基酸的区域比对两条序列。更优选地,查询序列至少100个氨基酸长,GAP分析在至少100个氨基酸的区域比对两条序列。更优选地,查询序列至少250个氨基酸长,GAP分析在至少250个氨基酸的区域比对两条序列。更优选地,GAP分析对两条序列的全长进行比对。
此处所用“生物活性”片段是指本发明多肽的一部分,其保持了该全长多肽的确定的活性,即用来产生丝的能力。生物活性片段可为任意长度,只要它们保持了所述的确定的活性。
对于所限定的多肽,应理解比上述%同源性高的数值包括了优选的实施方式。因此,在适用的情况下,根据最低%同源性数值,所述的多肽包括的氨基酸序列,与相应的指定SEQ ID NO具有下述同源性:优选地至少40%,更优选地至少45%,更优选地至少50%,更优选地至少55%,更优选地至少60%,更优选地至少65%,更优选地至少70%,更优选地至少75%,更优选地至少80%,更优选地至少85%,更优选地至少90%,更优选地至少91%,更优选地至少92%,更优选地至少93%,更优选地至少94%,更优选地至少95%,更优选地至少96%,更优选地至少97%,更优选地至少98%,更优选地至少99%,更优选地至少99.1%,更优选地至少99.2%,更优选地至少99.3%,更优选地至少99.4%,更优选地至少99.5%,更优选地至少99.6%,更优选地至少99.7%,更优选地至少99.8%,更优选地至少99.9%。
本发明多肽的氨基酸序列突变体可通过向本发明的核酸中引入适当的改变的核苷酸而制备,或通过体外合成所需的多肽。所述的突变体包括,例如在氨基酸序列内进行残基的删除、插入或替换。可组合运用删除、插入和替换来获得最终的构建物,只要最终的多肽产物具有所需的特性。
突变(改变的)多肽可通过本领域已知的任何技术制备。例如,可对本发明的多核苷酸进行体外诱变。所述的体外诱变技术包括将该多核苷酸亚克隆到适当的载体,转化该载体到“突变”株如大肠杆菌XL-1红(Stratagene),并使转化的细菌繁殖适当的世代。另一个例子中,对本发明的多核苷酸使用DNA穿梭技术,该技术已被Harayama明白的描述(1998)。这些DNA穿梭技术可包括本发明的基因,并可能还有与本发明基因相关的基因,如来源于此处所述具体物种之外的其他膜翅目和脉翅目物种的丝基因。突变/改变的DNA获得的产物可通过此处描述的技术容易得筛选确定它们能否用作丝蛋白。
在涉及氨基酸序列突变体过程中,突变位点的位置和突变的性质依赖于将要修饰的性状。可对突变的位点进行单个修饰,或进行一系列修饰,例如通过(1)首先进行保守氨基酸替换,然后根据获得的结果进行更激进的替换,(2)删除目标残基,或(3)在该位点附近插入其他残基。
删除的氨基酸序列一般在约1到15个残基的范围内,更优选地约1到10个残基,典型地约1到5个连续残基。
替换突变中该多肽分子去除至少一个氨基酸残基并在该位置插入一个不同残基。最感兴趣的替换诱变位点包括已鉴定为重要的功能位点。其他感兴趣的位点是那些不同株或物种中特定残基相同的位点。这些位点可能对于生物活性是重要的。对这些位点,尤其是至少三个其他完全相同的保守位点,优选地通过一种相对保守的方式进行替换。这些保守的替换列在标题为“典型的替换”的表1中。
如上所述,一些本发明多肽的一部分具有卷曲螺旋结构,多肽的卷曲螺旋结构特征为七肽重复,以一致序列(abcdefg)n表示。在一个优选的实施方式中,该多肽具有卷曲螺旋结构的部分包括至少10拷贝的七肽序列abcdefg,并且至少25%的a和d为氨基酸为丙氨酸残基。
表1.典型的替换
  原残基  典型的替换
  Ala(A)  val;leu;ile;gly;cys;ser;thr
  Arg(R)  lys
  Asn(N)  gln;his
  Asp(D)  glu
  Cys(C)  Ser;thr;ala;gly;val
  Gln(Q)  asn;his
  Glu(E)  asp
  Gly(G)  pro;ala;ser;val;thr
  His(H)  asn;gln
  Ile(I)  leu;val;ala;met
  Leu(L)  ile;val;met;ala;phe
  Lys(K)  arg
  Met(M)  leu;phe
  Phe(F)  leu;val;ala
  Pro(P)  gly
  Ser(S)  thr;ala;gly;val;gln
  Thr(T)  ser;gln;ala
  Trp(W)  tyr
  Tyr(Y)  trp;phe
  Val(V)  ile;leu;met;phe;ala;ser;thr
在一个优选的实施方式中,具有卷曲螺旋结构的多肽包括至少12个连续拷贝,更优选地至少15个连续拷贝,更优选地至少18个连续拷贝的七肽。进一步的实施方式中,所述的具有卷曲螺旋结构的多肽含有达到至少28拷贝的七肽。典型地,该七肽的拷贝是串联重复的(tandemly repeated)。然而,它们不一定必须是精确的串联重复,例如,如图5和图6所示,可能在两个七肽间发现一些氨基酸,或可能发现一些截断的七肽(例如,见图5中Xenospiral)。
图5和图6以及表6-10提供了对具有卷曲螺旋结构的本发明多肽可进行的氨基酸替换的指南。当此处提供的基于实验数据的预测有用的氨基酸替换与表1提供的典型的替换有任何形式的冲突时,优选地使用基于实验数据的替换。
本发明多肽的卷曲螺旋结构具有高丙氨酸残基含量,特别是在七肽的a、d和e氨基酸位。然而,b、c、f和g位也有高频率的丙氨酸残基。在一个优选实施方式中,至少15%的七肽的a、d和/或e位氨基酸是丙氨酸残基是丙氨酸残基,更优选地至少25%,更优选地至少30%,更优选地至少40%,更优选地至少50%。在进一步的优选实施方式中,至少25%的七肽的a和d位氨基酸都是丙氨酸残基,更优选地至少30%,更优选地至少40%,更优选地至少50%。此外,优选地至少15%的七肽b、c、f和g位氨基酸是丙氨酸残基,更优选地至少20%,更优选地至少25%。
典型地,该七肽不包括脯氨酸或组氨酸残基。而且,该七肽中,下列残基如果有,也是很少的(1或2个),这些残基为苯丙氨酸、甲硫氨酸、酪氨酸、半胱氨酸、甘氨酸或色氨酸残基。除了丙氨酸,该七肽中通常的(例如,多于5%,更优选地多于10%)氨基酸包括亮氨酸(特别是在b和d位)、丝氨酸(特别是在b、e和f位)、谷氨酸(特别是在c、e和f位)、赖氨酸(特别是在b、c、d、f和g位),以及g位的精氨酸。
本发明的多肽(和多核苷酸)可从广泛的膜翅目和脉翅目昆虫物种中纯化(分离)获得。膜翅目昆虫的例子包括但不限于细腰(Apocrita)亚目的任何种(蜜蜂、蚂蚁和黄蜂),其包括下列各科昆虫:青蜂科(Chrysididae)(青蜂,cuckoo wasps)、蚁科(Formicidae)(蚂蚁,ants)、蚁蜂科(Mutillidae)(蚁蜂,velvet ants)、蛛蜂科(Pompilidae)(蛛蜂,spider wasps)、土蜂科(Scoliidae)、胡蜂科(Vespidae)(黄蜂,paper wasps、蜾蠃potter wasps、虎头蜂hornets)、榕小蜂科(Agaonidae)(榕小蜂,fig wasps)、小蜂科(Chalcididae)(小蜂,chalcidids)、蚁小蜂科(Eucharitidae)(蚁小蜂,eucharitids)、旋小蜂科(Eupelmidae)(旋小蜂,eupelmids)、金小蜂科(Pteromalidae)(金小蜂,pteromalids)、旗腹姬蜂科(Evaniidae)(瘦蜂,ensign wasps)、茧蜂科(Braconidae)、姬蜂科(Ichneumonidae)(姬蜂,ichneumons)、切叶峰科(Megachilidae)、蜜蜂科(Apidae)、分舌花蜂科(Colletidae)、集蜂科(Halictidae)和准蜜蜂科(Melittidae)(集油蜜蜂,oil collectingbees)。脉翅目昆虫的例子包括下列各科昆虫的种:螳蛉科(Mantispidae)、草蛉科(Chrysopidae)(草蜻蛉,lacewings)、蚁蛉科(Myrmeleontidae)(蚁狮antlions)和蝶角蛉科(Ascalaphidae)(枭蝇,owlflies)。这类更多的多肽(和多核苷酸)可用此处描述的同样程序从来源于授粉熊蜂(Bombus terrestris)、牛头犬蚁(Myrmeciaforficata)、黄猄蚁(Oecophylla smaragdina)和玛草蛉(Mallada signata)的丝中鉴定其特性。
此外,如果需要,非自然存在的氨基酸或化学氨基酸类似物可通过替代或加入而引入本发明的多肽中。这些氨基酸包括但不限于一般氨基酸的右旋体、2,4-二氨基丁酸、α-氨基异丁酸、4-氨基丁酸、2-氨基丁酸、6-氨基己酸、2-氨基异丁酸、3-氨基丙酸、鸟氨酸、正亮氨酸、正缬氨酸、羟脯氨酸、肌氨酸、瓜氨酸、高瓜氨酸、磺丙氨酸、叔丁基甘氨酸、叔丁基丙氨酸、苯基甘氨酸、丙氨酸环己酯、β-丙氨酸、氟氨基酸、设计的氨基酸如β-甲基氨基酸、Cα-甲基氨基酸、Nα-甲基氨基酸以及一般的氨基酸类似物。
本发明的范围内也包括在合成过程中或合成后进行不同修饰的本发明多肽,例如,生物素化、苄基化、糖基化、乙酰化、磷酸化、酰胺化、已知保护/封闭基团衍生化、蛋白水解性裂解、结合抗体分子或其他细胞配基等。这些修饰可能起到增强本发明多肽的稳定性和/或生物活性的作用。
本发明多肽可通过许多方法生产,包括自然多肽的生产和回收、重组多肽的生产和回收以及化学合成这些多肽。在一个实施方式中,分离的本发明多肽通过在有效产生该多肽的条件下培养能够表达所述的多肽的细胞,并回收该多肽而获得。优选的要培养的细胞为本发明的重组细胞。有效的培养条件包括但不限于允许多肽生产的有效的培养基、生物反应器、温度、pH和氧气条件。有效的培养基是指用来培养产生本发明多肽细胞的任何培养基。该培养基典型地包括含有可同化碳、氮和磷酸盐来源,以及适当的盐、矿物质、金属和其他营养素如维生素的水性培养基。本发明的细胞可通过传统的发酵生物反应器、摇瓶、试管、微量滴定盘以及培养皿中培养。培养可在适合重组细胞的温度、pH和氧气环境中进行。该培养条件在本领域普通技术人员的技术范围内。
多核苷酸
所述的“分离的多核苷酸”,包括DNA、RNA或其组合、单链或双链、正义链或反义链方向或其组合、dsRNA或其他,是指至少部分地从它天然状态下结合或连接的多核苷酸序列中分离出来的多核苷酸序列。优选地,分离的多核苷酸至少60%游离、优选地至少75%游离、最优选地至少90%游离于它们自然状态下结合的其他成分。此外,此处使用的术语“多核苷酸”与术语“核酸”可相互替换。
在多核苷酸语境中使用的术语“外源的”是指与其天然状态相比以一种数量发生改变的方式出现在细胞或无细胞表达系统中。在一个实施方式中,所述的细胞是在天然状态下不包括该多核苷酸的细胞。然而,所述的细胞可以是包括导致其编码多肽的产量发生改变,优选的为增加的非外源多核苷酸的细胞。本发明的外源多核苷酸包括尚未从存在该多核苷酸的转基因(重组)细胞或无细胞表达系统的其他成分中分离出来的多核苷酸,以及在上述细胞或无细胞系统中产生而后从至少一些其他成分中纯化出来的多核苷酸。
多核苷酸的%同源性(identity)通过GAP(Needleman和Wunsch,1970)分析(GCG程序)确定,其缺口产生罚分(gap creationpenalty)=5,缺口延伸罚分(gap extensionpenalty)=0.3。除非另有说明,查询序列至少45个核苷酸长,GAP分析在至少45个核苷酸的区域比对两条序列。优选地,查询序列至少150个核苷酸长,GAP分析在至少150个核苷酸的区域比对两条序列。更优选地,查询序列至少300个核苷酸长,GAP分析在至少300个核苷酸的区域比对两条序列。更优选地,GAP分析对两条序列的全长进行比对。
对于所限定的多核苷酸,应理解比上述%同源性高的数值包括了优选的实施方式。因此,在适用的情况下,根据最低%同源性数值,所述的多核苷酸包括的序列,与相应的指定SEQ ID NO具有下述同源性:优选地至少40%,更优选地至少45%,更优选地至少50%,更优选地至少55%,更优选地至少60%,更优选地至少65%,更优选地至少70%,更优选地至少75%,更优选地至少80%,更优选地至少85%,更优选地至少90%,更优选地至少91%,更优选地至少92%,更优选地至少93%,更优选地至少94%,更优选地至少95%,更优选地至少96%,更优选地至少97%,更优选地至少98%,更优选地至少99%,更优选地至少99.1%,更优选地至少99.2%,更优选地至少99.3%,更优选地至少99.4%,更优选地至少99.5%,更优选地至少99.6%,更优选地至少99.7%,更优选地至少99.8%,更优选地至少99.9%。
本发明的多核苷酸可包括与天然存在的分子相比具有一个或一个以上的核苷酸残基缺失、插入或替换的突变。突变体可以是自然发生的(即,从自然来源分离的),也可以是合成的(例如,在该核酸上进行定向诱变)。
本发明的寡核苷酸和/或多核苷酸在严谨的条件下与本发明的丝基因或所述的基因的侧翼区杂交。此处所用的术语“严谨的杂交条件”等是指本领域熟悉的参数,包括随寡核苷酸长度改变杂交温度。核酸杂交参数可在编辑该方法的参考文献中找到,如Sambrook等人(见前述)和Ausubel等人(见前述)。例如,此处所用的严谨的杂交条件,可指在杂交缓冲液(3.5×SSC、0.02%聚蔗糖、0.02%聚乙烯吡咯烷酮、0.02%牛血清白蛋白(BSA)、2.5mM NaH2PO4(pH7)、0.5%SDS、2mM EDTA)中65℃杂交,然后在50℃0.2×SSC,0.01%BSA中洗一次或一次以上。另外,核酸和/或寡核苷酸(也可称为“引物”或“探针”)在核酸扩增技术如PCR中使用的条件下与感兴趣的昆虫基因组区杂交,如蜜蜂的基因组。
本发明的寡核苷酸可为RNA、DNA或其衍生物。尽管术语多核苷酸和寡核苷酸的意思有重叠的地方,寡核苷酸典型地是指相对短的单链分子。该寡核苷酸的最小值为寡核苷酸与目标核酸分子上的互补序列形成稳定杂交分子所需的大小。优选地,该寡核苷酸至少有15个核苷酸,更优选地至少有18个核苷酸,更优选地至少有19个核苷酸,更优选地至少有20个核苷酸,更优选地至少有25个核苷酸长度。
一般而言,多核苷酸或寡核苷酸单体通过磷酸二酯键或其类似连接连接形成从相对短的单体单元如12-18个到几百个单体单元大小的寡核苷酸。磷酸二酯键的类似连接包括:磷硫酰、二硫代磷酸酯、磷硒酰(phosphoroselenoate)、二硒代磷酸酯(phosphorodiselenoate)、硫代磷酸苯胺(phosphoroanilothioate)、磷酸苯胺(phosphoranilidate)、氨基磷酸酯(phosphoramidate)。
本发明包括可用于鉴别核酸分子的探针或产生核酸分子的引物之类的寡核苷酸。用作探针的本发明寡核苷酸典型地与放射性同位素、酶、生物素、荧光分子或化学发光分子之类的可检测的标记物相结合。
重组载体
本发明的一个实施方式包括一种重组载体,该重组载体包括至少一种插入到任何能够将本发明多核苷酸传递到宿主细胞的载体中的本发明的分离多核苷酸。所述的载体包括异源多核苷酸序列,即那些并不天然出现在本发明多核苷酸分子附近的多核苷酸序列,并且优选地该多核苷酸序列来源于与本发明多核苷酸序列不同的物种。该载体可为RNA或DNA,原核的或真核的,且典型地为转座子(诸如US 5,792,294中所描述的)、病毒或质粒。
一种类型的重组载体包括可操作的连接到表达载体的本发明的多核苷酸分子。可操作的连接是指将多核苷酸分子以转化入宿主细胞中时该分子能够表达的方式插入到表达载体中。此处所用的表达载体是指能够转化宿主细胞并能够有效表达指定多核苷酸分子的DNA或RNA载体。优选地,该表达载体也能够在宿主细胞内复制。表达载体可为原核的或真核的,典型地为病毒或质粒。本发明的表达载体包括任何在本发明重组细胞中发挥功能(即指导基因表达)的载体,包括在细菌、真菌、内寄生物、节肢动物、动物和植物细胞中。本发明特别优选的表达载体能够在植物细胞中指导基因表达。本发明的载体也能用于在无细胞表达系统中产生多肽,该系统是本领域熟知的。
特别地,本发明的表达载体包括如转录控制序列、翻译控制序列、复制起始点等调节序列,以及其他与重组细胞相容的和控制本发明多核苷酸分子表达的调节序列。特别地,本发明的重组分子包括转录控制序列。转录控制序列是控制转录起始、延伸和终止的序列。特别重要的转录控制序列是控制转录起始的序列,如启动子、增强子、操纵子和阻遏物序列。适当的转录控制序列包括能够在至少一种本发明重组细胞中发挥功能的任何转录控制序列。许多这样的转录控制序列是本领域技术人员已知的。优选的转录控制序列包括在细菌、酵母、节肢动物、植物或哺乳动物细胞中发挥功能的序列,如下所述但并不局限于此:tac、lac、trp、trc、oxy-pro、omp/lpp、rrnB、噬菌体λ、噬菌体T7、T7lac、噬菌体T3、噬菌体SP6、噬菌体SP01、金属硫蛋白、α交配因子、毕赤酵母乙醇氧化酶、α病毒亚基因组启动子(如Sindbis病毒亚基因组启动子)、抗生素抗性基因、杆状病毒、玉米夜蛾昆虫病毒、痘苗病毒、疱疹病毒、浣熊痘病毒、其他痘病毒、腺病毒、巨细胞病毒(如中间体早期启动子)、猿猴病毒40、逆转录病毒、肌动蛋白、逆转录病毒长末端重复、劳氏肉瘤病毒、热休克、磷酸盐和硝酸盐转录控制序列,以及其他能够在原核或真核细胞中控制基因表达的序列。
特别优选的转录控制序列为在植物中有指导转录活性的启动子,可以是组成型的或阶段和/或组织特异性的,取决于所用的植物或植物部分。植物启动子包括但不限于组成型表达的启动子,如花椰菜花叶病毒(CaMV)的35S启动子,叶特异性表达的,如二磷酸核酮糖羧化酶小亚基基因启动子,根特异性表达的,如谷氨酰胺合酶基因启动子,种子特异性表达的,如甘蓝型油菜cruciferin A基因启动子,块茎特异性表达的,如马铃薯I类patatin基因启动子,以及果实特异性表达的,如番茄的多聚半乳糖醛酸酶(PG)启动子。
本发明的重组分子也可包括(a)分泌信号(即信号片段核酸序列),以使本发明的表达多肽从产生该多肽的细胞分泌出来和/或(b)融合序列,以便以融合蛋白的形式表达本发明的核酸分子。信号片段的例子包括能够指导本发明多肽分泌的任何信号片段。优选的信号片段包括但不限于组织纤维蛋白溶酶原激活物(t-PA)、干扰素、白介素、生长激素、病毒被膜糖蛋白信号片段、Nicotiana nectarin信号肽(US 5,939,288)、烟草伸展蛋白信号、大豆油质蛋白油体结合蛋白信号、拟南芥液泡碱性几丁质酶信号肽,以及本发明多肽的天然信号序列。此外,本发明核酸分子可连接到指导所编码的多肽到蛋白体(proteosome)的融合片段上,如泛素融合片段。重组分子也可包括本发明核酸序列周围和/或内部插入的和/或非翻译序列。
宿主细胞
本发明另外一个实施方式包括一种重组细胞,该重组细胞包括一种或一种以上本发明重组分子转化的宿主细胞,或其子代细胞。可通过任何能够将多核苷酸分子插入细胞中的方法将多核苷酸分子转化进入细胞。转化技术包括但不限于转染、电穿孔、显微注射、脂质转染、吸附和原生质融合。重组细胞可保持为单细胞或长成组织、器官或多细胞生物体。转化的本发明多核苷酸分子可保持在染色体外,也可以保留表达能力的方式整合到被转化(即重组)细胞染色体上的一个或一个以上的位点。
适当的将要进行转化的宿主细胞包括任何能用本发明多核苷酸转化的细胞。本发明宿主细胞可为能够产生本发明多肽的内源的(即天然的)细胞,也可为通过至少一种本发明多核苷酸分子转化后能够产生所述的多肽的细胞。本发明的宿主细胞可为任何能够产生至少一种本发明蛋白质的细胞,包括细菌、真菌(包括酵母)、寄生虫、节肢动物、动物和植物细胞。宿主细胞的例子包括沙门氏菌、埃希菌属、杆菌、李斯特菌属、酵母、夜蛾(Spodoptera)、分枝杆菌、Trichoplusia、BHK(幼仓鼠肾)细胞、MDCK细胞、CRFK细胞、CV-1胞、COS(例如COS-7)细胞和Vero细胞。更多的宿主细胞例子如大肠杆菌,包括大肠杆菌K-12衍生物;伤寒沙门氏菌;鼠伤寒沙门氏菌,包括减毒菌株;贪食夜蛾;粉纹夜蛾;以及非致瘤性小鼠生肌G8细胞(例如ATCC CRL 1246)。其他适当的哺乳动物宿主细胞包括其他肾细胞系、其他成纤维细胞系(如人、鼠、鸡胚成纤维细胞系)骨髓瘤细胞系、中国仓鼠卵巢细胞、小鼠NIH/3T3细胞、LMTK细胞和/或HeLa细胞。特别优选的宿主细胞是可从Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH(德国微生物和细胞培养物收藏所)等处获得的植物细胞。
重组DNA技术可用来改善转化的多核苷酸分子的表达,通过操作如宿主细胞内多核苷酸分子的拷贝数,多核苷酸分子转录的效率、产生的转录本翻译的效率,以及翻译后修饰的效率等。可用于提高本发明多核苷酸分子表达的重组技术包括但不限于多核苷酸分子可操作的连接到高拷贝数的质粒、多核苷酸分子整合到一个或一个以上的宿主细胞染色体中、向质粒中加入载体稳定性序列、替换或修饰转录控制信号(如启动子、操纵子、增强子)、替换或修饰翻译控制信号(如核糖体结合位点,Shine-Dalgarno序列)、修饰本发明多核苷酸分子以符合宿主细胞使用的密码子,以及删除使转录本不稳定的序列。
转基因植物
术语“植物”是指整株植物、植物器官(如叶、茎、根等)、种子、植物细胞等等。本发明使用的植物包括单子叶植物和双子叶植物。目标植物包括但不限于下列植物:谷类(小麦、大麦、黑麦、燕麦、稻、高粱和相关作物);甜菜属(甜菜和饲用甜菜);梨果、核果和软果(苹果、梨、李子、桃、扁桃、樱桃、草莓、覆盆子和黑莓);豆科植物(豆类、扁豆、豌豆、大豆);油类植物(油菜、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油类植物、可可豆、落花生);黄瓜植物(marrows、黄瓜、瓜类);纤维植物(棉花、亚麻、大麻、黄麻);柑橘类水果(橙、柠檬、葡萄柚、蜜桔);蔬菜(菠菜、莴苣、芦笋、卷心菜、胡萝卜、洋葱、番茄、马铃薯、红辣椒);樟科(酪梨、肉桂、樟脑);或如玉米、烟草、坚果、咖啡、甘蔗、茶、藤、蛇麻花、草、香蕉和天然橡胶之类的植物,以及观赏植物(花、灌木、阔叶树和常绿植物如松柏类植物)。
本发明文中限定的转基因植物包括植物(即所述植物的部分和细胞)及其子代,其子代通过使用重组技术进行基因修饰,以在所需的植物或植物器官中产生至少一种本发明的多肽。转基因植物可通过本领域已知的技术产生,如A.Slater等人在Plant Biotechnology-The Genetic Manipulation of Plants(植物生物技术——植物基因操作),(Oxford University Press(2003)),以及P.Christou和H.Klee在Handbook of Plant Biotechnology(植物生物技术手册),John Wiley and Sons(2004))中广泛描述的。
本发明多核苷酸可在转基因植物所有发育阶段组成型表达。根据所用植物或植物器官,所述的多肽可通过阶段特异性的方式表达。此外,所述的多核苷酸可组织特异性的表达。
已知的或发现能够使编码感兴趣多肽的基因在植物中表达的调节序列可用于本发明。对所用调节序列的选择取决于感兴趣的目标植物和/或植物器官。所述的调节序列可取自植物或植物病毒,或可通过化学合成。所述的调节序列是本领域技术人员熟知的。
组成型植物启动子是人们熟知的。除上述提到的启动子外,一些其他适当的启动子包括但不限于胭脂碱合酶启动子、章鱼碱合酶启动子、CaMV 35S启动子、核酮糖-1,5二磷酸羧化酶启动子、Adhl-based pEmu、Actl、SAM合酶启动子、Ubi启动子以及叶绿素a/b结合蛋白启动子。另外可能需要转基因以一种受调节的方式表达。通过将丝蛋白的编码序列置于组织特异性、发育特异性或可诱导启动子的控制下,对多肽调节表达是可能的。已经有一些植物中组织特异性的调节基因和/或启动子的报道。其包括编码种子贮藏蛋白(如napin、cruciferin、β-conglycinin、大豆球蛋白和菜豆球蛋白)、玉米醇溶蛋白或油体蛋白(如油质蛋白)、或涉及脂肪酸生物合成的基因(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad2-1))和其他胚胎发育过程中表达的基因(如Bce4)。对种子特异性表达特别有用的为豌豆球蛋白启动子。其他用于成熟叶中表达的启动子是那些开启衰老起始的启动子,如拟南芥中SAG启动子)。US 4,943,674讨论了一类在开花期或在开花期经过果实发育,至少到开始成熟的过程中果实特异性表达的启动子。其他组织特异性启动子的例子包括在块茎中(如patatin基因启动子)和纤维细胞中(一个受发育调节的纤维细胞蛋白的例子是E6纤维)指导表达的启动子。
其他调节序列如终止子序列和多腺苷酸化信号包括任何在植物中发挥该功能的序列,其选择对于本领域技术人员是显而易见的。由于终止区似乎是相对可相互替换的,因而主要根据方便选择表达盒中使用的终止区。所用的终止区可能是与转录起始区天然配套的、可能是与感兴趣的多核苷酸序列天然配套的或者是来自于其他来源的。终止区可以是天然存在的,也可以是完全或部分合成的。方便的终止区可从农杆菌(A.tumefaciens)Ti质粒中获得,如章鱼碱合酶和胭脂碱合酶终止区,或从β菜豆球蛋白基因、化学诱导的lant基因pIN中获得。
一些技术可用于将包括编码感兴趣的多肽的核酸序列的表达构建物引入目标植物中。该技术包括但不限于用钙/聚乙二醇方法转化原生质体、电穿孔和显微注射或(包被的)粒子轰击。除了这些称为直接DNA转化法之外,涉及载体的转化系统是广泛可得的,如病毒和细菌载体(例如来自于农杆菌属)。在选择和/或筛选后,被转化的原生质体、细胞或植物部分可通过本领域已知的方法再生成整株植物。转化和/或再生技术的选择对本发明来说并不严谨。
为证实转基因存在与转基因细胞和植物中,可通过本领域技术人员已知的方法进行聚合酶链反应(PCR)扩增或Southern印迹分析。可用诸多可用方法中的任何一种检测转基因的表达产物,取决于产物的性质,包括Western印迹和酶鉴定。一种定量蛋白表达及检测不同植物组织中复制的特别有用的方法是应用报告基因,如GUS。获得转基因植物后,可对其进行栽培以产生具有所需表型的植物组织或植物部分。可收割该植物组织或植物部分,和/或采集种子。该种子可作为栽培具有所需性状组织或部分的植物的来源。
非人类转基因动物
产生转基因动物的方法是本领域所熟知的。对这一主题有用的全面的教科书是Houdebine的Transgenic animals-Generation and Use  (转基因动物——产生和用途)(Harwood Academic,1997)。
异源DNA可引入如哺乳动物受精卵中。例如,全能或多能干细胞可通过显微注射、磷酸钙沉淀、脂质体融合、逆转录病毒感染或其他方法转化,转化的细胞引入胚胎中,胚胎发育成转基因动物。在高度优选的方法中,用含有所需DNA的逆转录病毒感染发育的胚胎,然后感染的胚胎产生转基因动物。然而,在最优选的方法中,适当的DNA共注射到胚胎的前核或胞质中,优选地在单细胞期,该胚胎发育成成熟的转基因动物。
用来产生转基因动物的另外一种方法涉及使用标准方法将核酸显微注射到前核期卵中,然后在移植到假孕受者的输卵管中之前培养注射的卵。
转基因动物也可通过核移植技术产生。在该方法中,使用包括在调节序列控制下的感兴趣的结合结构域或结合配偶体(binding partner)的编码序列的质粒稳定地转染供者动物的成纤维细胞。然后将稳定的转染子与去核的卵母细胞融合,培养并移植到雌性受者中。
丝的回收方法和生产
本发明的丝蛋白可从重组细胞,如植物、细菌或酵母细胞中提取和纯化,通过多种方法生产所述的蛋白。在一个实施方式中,该方法涉及通过降低pH和加热,然后采用硫酸铵分级分离从同质化(homogenized)的细胞/组织/植物等中去除天然的细胞蛋白。简单的说,通过同质化细胞/组织/植物提取总可溶性蛋白。通过pH 4.7沉淀然后60℃处理去除天然蛋白。产生的上清液用40%饱和度的硫酸铵分级分离。产生的蛋白质将具有95%级的纯度。可通过常规的胶或亲和层析获得进一步的纯化。
在另外一个例子中,使用高浓度的酸,如HCl或丙酸降低pH到~1-2一小时或一小时以上处理细胞裂解物,该处理将使丝蛋白溶解但使其他蛋白沉淀。
当蛋白浓度超过关键值时,本发明丝蛋白通过自发的自组装从溶液中形成纤维状聚集物。可按照O′Brien等人的方法收集该聚集物并将其机械纺织成肉眼可见的纤维(I.O′Brien等人″Design,Synthesis and Fabrication of Novel Self-AssemblingFibrillar Proteins(新的自组装纤维状蛋白质的设计、合成和组装)″,Silk Polymers:Materials Science and Biotechnology,pp.104-117,Kaplan,Adams,Farmer和Viney,eds.,c.1994,American Chemical Society,Washington,D.C)。
根据卷曲螺旋二级结构的固有性质,诸如Xenospira1-4、BBF 1-4、BAF 1-4和GAF 1-4在脱水时会自发形成卷曲螺旋的二级结构。如下所述,可通过对临近赖氨酸进行酶或化学交联增强卷曲螺旋的强度。
本发明的丝纤维和/或共聚物对加工处理的要求不高。本发明的丝蛋白要求最小的加工处理,例如纺织形成强纤维,因为它们自发形成强的卷曲螺旋,并可通过如赖氨酸交联等交联而进一步增强。这与家蚕和蜘蛛的重组丝多肽形成对比,后者需要复杂的纺织技术以获得二级结构(β-片层)和纤维的强度。
然而,纤维可从具有液晶相特征属性的溶液中抽出。能够产生相变的纤维浓度取决于溶液中一种蛋白质的组成或几种蛋白质的组合。相变可通过监测溶液的透明度和双折射来进行检测。当溶液具有半透明的表现并且通过交叉的偏振滤光片观察时记录有双折射时,可检测到液晶相的起始。
在一种形成纤维的技术中,纤维可首先通过一个孔口(orifice)从蛋白溶液中拉出并进入甲醇中,直到产生足够使用机械装置拾起的长度。然后通过该机械装置拉出纤维通过甲醇溶液,收集并干燥。拉拔纤维的方法被认为是本领域熟知的。
US 2004/0170827和US 2005/0054830描述了更多可用来生产本发明丝纤维和/或共聚物的方法的例子。
在一个优选的实施方式中,本发明丝纤维和/或共聚物是交联的。在一个实施方式中,所述的丝纤维和/或共聚物通过本领域已知的方法交联到感兴趣的表面/物品/产品等上。在另一个实施方式中(或与前面的实施方式结合),丝纤维和/或共聚物中至少一些丝蛋白相互交联。优选地,丝蛋白通过蛋白质中的赖氨酸残基交联。该交联可通过本领域已知的化学和/或酶技术进行。例如酶交联可被赖氨酸氧化酶催化,而非酶交联可通过糖化的赖氨酸残基产生(Reiser等人,1992)。
抗体
本发明也提供本发明多肽或其片段的单克隆或多克隆抗体。因此,本发明进一步提供生产本发明多肽的单克隆或多克隆抗体的方法。
术语“结合特异性”是指抗体结合至少一种本发明多肽而不是其他已知丝蛋白的能力。
此处所用的术语“表位”是指被抗体结合的本发明多肽的区。表位可给予动物以产生抗该表位的抗体,然而,本发明的抗体优选地在整个多肽的环境中特异性的结合表位区。
如果需要多克隆抗体,使用本发明的免疫原性多肽免疫选定的哺乳动物(小鼠、兔、山羊、马等)。根据已知的程序收集和处理免疫动物的血清。如果包括多克隆抗体的血清包括对其他抗原的抗体,该多克隆抗体可通过免疫亲和层析进行纯化。生产和处理多克隆抗血清的技术是本领域已知的。为制造所述的抗体,本发明也提供本发明多肽或其片段作为半抗原连接到另外的多肽用作动物中的免疫原。
本领域技术人员也可以容易地生产抗本发明多肽的单克隆抗体。通过杂交瘤制作单克隆抗体的一般方法是人们熟知的。产生永生抗体的细胞系可通过细胞融合产生,也可通过其他技术如致癌DNA转化B淋巴细胞,或EB病毒(Epstein-Barrvirus)转染。可根据不同的特性筛选单克隆抗体组;即同种型和表位亲和力。
另外一种技术涉及筛选噬菌体展示库,其中,例如噬菌体在其被膜上表达带有大量多种互补决定区(CDRs)的scFV片段。该技术是本领域熟知的。
为本发明的目的,术语“抗体”,除非有相反的说明,包括保留了对目标抗原结合活性的完整抗体片段。所述的片段包括Fv、F(ab′)和F(ab′)2片段,以及单链抗体(scFv)。此外,抗体及其片段可为人源化抗体,例如EP-A-239400中描述的。
本发明的抗体可结合到固相支持物和/或同适当的试剂、对照、说明书之类的一起装入适当的容器包装到试剂盒中。
优选地,本发明的抗体带有可检测的标记。代表性的允许直接检测抗体结合的可检测标记包括放射性标记、荧光团、染料、磁珠、化学发光基团、胶体颗粒等等。允许直接测量结合的标记的例子包括底物提供有色或荧光产物的酶。另外的代表性可检测的标记包括加入适当底物后能提供可检测产物信号的共价结合的酶。用来结合的适当的酶的例子包括辣根过氧化物酶、碱性磷酸酶、苹果酸脱氢酶等等。若商业上不可获得,所述的抗体-酶结合物可通过本领域技术人员已知的技术容易的生产。更多的代表性的可检测的标记包括对抗生物素蛋白或抗生物素蛋白链菌素有高亲和力的生物素;可与荧光激活细胞分类器一起使用的荧光色素(例如藻胆蛋白、藻红蛋白和别藻蓝蛋白;荧光素和德克萨斯红);及其类似物质。优选地,可检测标记允许在光度计盘中直接测量,例如生物素。所述的标记抗体可通过本领域已知的方法检测本发明的多肽。
组合物
本发明的组合物可包括“可接受的载体”,该可接受的载体的例子包括水、盐水、任氏液、葡萄糖溶液、Hank′s液,以及其他含水生理平衡盐溶液。也可使用非水性载体,如不挥发油、麻油、油酸乙酯或甘油三酯。
在一个实施方式中,“可接受的载体”是“药学上可接受的载体”。术语药学上可接受的载体是指给予动物,特别是哺乳动物,更特别的是人的时候不产生过敏,毒性或不良反应的分子实体或组合物。有用的药学上可接受的载体或稀释剂的例子包括但不限于不影响本发明多肽活性的溶剂、分散剂、包衣、稳定剂、保护性胶体、粘合剂、增稠剂、摇溶剂、渗透剂、掩蔽剂和等渗和缓释剂。可通过,例如使用包衣,如卵磷脂,在分散时维持所需的粒子大小以及使用表面活性剂来维持适当的流动性。更普遍地,本发明多肽可通过相应的通常使用的配制技术和任何无毒的固体或液体添加剂联合使用。
如此处概括的,在一些实施方式中,本发明的多肽、丝纤维和/或共聚物用作药学上可接受的载体。
下面描述了本发明多肽具体用途的其他适当组合物,具有具体的参考资料。
用途
由于其特别的韧性和强度,丝蛋白可用于创造新的生物材料。然而,至今为止蜘蛛和昆虫的纤维状蛋白质是大蛋白(大于100KDa),并由高度重复的氨基酸序列组成。这些蛋白质由包括高度偏爱性的密码子的大基因编码,使他们特别难以在重组系统中生产。相比之下,本发明的丝蛋白是短的和非重复的。这些特性使得编码这些蛋白的基因对于通过重组生产新的生物材料特别有吸引力。
本发明的丝蛋白、丝纤维和/或共聚物在医学、军事、工业和商业应用等广泛和多种领域中可以应用。纤维可用于制造医学用具如缝合、植皮、细胞生长基质、置换韧带、外科修补网状织物,以及用于工业和商业产品的广泛领域,如线缆、绳、网、鱼线、衣服织物、防弹背心、容器织物、背包、背囊、袋或钱包带、粘性结合材料、非粘性结合材料、带材料、帐篷织物、帆布、库覆盖物、车辆覆盖物、围墙材料、封闭剂、建筑材料、耐风雨材料、韧性隔离材料、运动器材;以及事实上可用于任何需要高拉伸强度和弹性特性的纤维和织物中。本发明的丝蛋白、丝纤维和/或共聚物也可用于个人护理产品组合物中,如化妆品、皮肤养护、护发和染发中;以及粒子的涂层,如色料。
丝蛋白可用其天然形式或修饰成具有更有益效果的衍生物。例如,丝蛋白可通过结合反应修饰成聚合物以降低变异原型,如US 5,981,718和US 5,856,451所述。适当的修饰聚合物包括但不限于聚烯化氧化物(polyalkylene oxides)、聚乙烯醇(polyvinyl alcohol)、聚羧酸盐(poly-carboxylates)、聚乙烯吡咯烷(poly(vinylpyrolidone))、和葡聚糖(dextrans)。在另外的例子中,丝蛋白的修饰可通过选择性消化和剪切其他蛋白修饰物。例如,丝蛋白可通过提高温度约60℃酸处理切成更小的肽单位。有用的酸包括但不限于稀盐酸、含硫和含磷酸。另外,丝蛋白的消化可通过碱处理完成,如氢氧化钠,或可使用适当的蛋白酶进行酶消化。
所述的蛋白质可通过进一步修饰以提供在个人护理产品中具有有益的特别用途的性能特性。对用于个人护理产品的蛋白修饰是本领域所熟知的。例如,常用的方法在US 6,303,752、US 6,284,246和US 6,358,501中有描述。修饰的例子包括但不限于乙氧基化以促进水乳化的增强、硅氧基化(siloxylation)以提供亲脂相容性、酯化以协助肥皂和洗涤剂组合物相容性。另外,丝蛋白可通过功能集团产生衍生物,功能基团包括但不限于胺、环氧乙烷、氰酸盐、羧酸酯、硅酮多羟基化合物(silicone copolyols)、硅氧烷酯、季铵化脂肪胺、氨基甲酸乙酯、聚丙烯酰胺、二羧酸酯和卤代酯。丝蛋白也可通过和二亚胺酯反应和形成金属盐产生衍生物。
与上述对“多肽”(及“蛋白质”)的定义一致,所述的衍生物和/或修饰分子此处也概括的称之为“多肽”和“蛋白质”。
本发明丝蛋白可与其他类型纤维纺在一起和/或成束或编织。其例子包括但不限于聚合纤维(如聚丙烯、尼龙、聚酯)、其他植物和动物来源的纤维或丝(如棉、毛、家蚕或蜘蛛丝)和玻璃纤维。优选的实施方式是丝纤维和10%的聚丙烯纤维编织。本发明包括可容易的用来增强任何想要特性的纤维组合的产物,例如外观、柔软性、重量、耐久性、抗水性、改善制造成本,这些可能是在制造和生产医学、工业或商业应用纤维过程中所一般寻求的性质。
个人护理产品
化妆品和皮肤养护组合物可为无水组合物,包括在化妆用介质中有效量的丝蛋白。这些组合物的用途包括但不限于皮肤养护、皮肤清洁、化妆和抗皱纹产品。化妆品和皮肤养护组合物中有效量的丝蛋白此处定义为约10-4到约30%的重量比例,但优选的从约10-3到15%重量,相对于组合物的总重量。该比例可根据化妆品或皮肤养护组合物的类型成函数变化。US 6,280,747中描述了化妆用介质的适当组合物。例如,化妆用介质可包括一般从相对于组合物总重约10到约90%重量比例的脂质,其中脂相包括至少一种液体、固体或半固体脂质。脂质包括但不限于油、蜡、树胶和所谓的糊状脂质。另外,组合物可为稳定分散的形式,如作为油包水或水包油乳状液。此外,该组合物可包括一种或一种以上常规的化妆品或皮肤病学的添加剂或佐剂,包括但不限于抗氧化剂、保藏剂、赋形剂、表面活性剂、UVA和/或UVB遮光剂、芳香剂、增稠剂、湿润剂和阴离子、非离子或两性聚合物,以及染料或色素。
包括至少一种本发明丝蛋白的使用乳化材料的可生产的乳化化妆品和准药物包括,例如,清洁化妆品(美容香皂、洁面、香波、淋洗等)、护发产品(染发剂、美发剂之类)、基本化妆品(一般乳膏、乳液、剃毛膏、调节剂、科隆香水、修面液、美容油、面膜等等)、化妆美容用品(底、画眉笔、眼膏、眼影、修眉液等等)、芳香化妆品(香水之类)、晒黑和防晒化妆品(晒黑和防晒霜、晒黑和防晒露、晒黑和防晒油等)、指甲化妆品(指甲油之类)、眼线化妆品(眼线膏之类)、唇化妆品(唇膏、唇霜之类)、口腔护理用品(牙刷之类)、洗浴用品(洗浴产品之类)等等。
化妆品组合物也可以指甲护理产品的形式,如指甲油。此处指甲油定义为处理和染色指甲的组合物,包括化妆用介质中有效量的丝蛋白。指甲油组合物中有效量的丝蛋白此处定义为相对于油总重约10-4到约30%的重量比例。US 6,280,747描述了指甲油化妆用介质的组成。指甲油典型的包括溶剂和膜形成物质,如纤维素衍生物、聚乙烯衍生物、丙烯酸脂聚合物或共聚物、乙烯共聚物或聚酯聚合物。该组合物也可包括有机或无机色素。
护发组合物此处定义为处理头发的组合物,包括但不限于香波、调节剂、洗液、气雾剂、凝胶剂和奶油冻剂,其中在化妆用介质中包括有效量的丝蛋白。护发组合物中有效量的丝蛋白此处定义为相对于该组合物总重约10-2到约90%的重量比例。US 2004/0170590、US 6,280,747、US 6,139,851和US 6,013,250中描述了护发组合物中化妆用介质的组成。例如护法组合物可为水、醇或水醇溶液,对于水醇溶液,醇优选地为乙醇或异丙醇,相对于总重约1-约75%的重量比例。此外,护发组合物可包括一种或一种以上常规的化妆品或皮肤病学的添加剂或佐剂,如上所述。
染发组合物此处定义为着色、染色、脱色的组合物,包括在化妆用介质中有效量的丝蛋白。染发组合物中有效量的丝蛋白此处定义为相对于该组合物总重约10-4到约60%的重量比例。US 2004/0170590、US 6,398,821和US 6,129,770中描述了染发组合物中化妆用介质的组成。例如,染发组合物一般包括无机过氧化染料氧化剂和可氧化着色剂。过氧化染料氧化剂最通常的是过氧化氢。氧化染发剂通过氧化偶联初级中间物(例如对苯二胺、对氨基苯酚、对二氨基嘧啶、羟基吲哚、吲哚胺、胸腺嘧啶胺或青色苯酚(cyanophenols)与次级中间物(例如苯酚、间苯二酚、m-氨基苯酚、m-苯二胺、萘酚、吡唑酮、羟基吲哚、儿茶酚或吡唑)而形成。另外,染发组合物可包括氧化酸、多价螯合剂、稳定剂、增稠剂、缓冲载体、表面活性剂、溶剂、抗氧化剂、聚合物、非氧化染料和调节剂。
丝蛋白也可用来包被色素和化妆品颗粒,以改善该颗粒的分散性,用于化妆品和包被组合物。化妆品颗粒此处定义为化妆品组合物中应用的如色素或惰性粒子之类的粒状物质。适当的色素和化妆品颗粒包括但不限于无机有色色素、有机色素和惰性粒子。无机有色色素包括但不限于二氧化钛、氧化锌、以及铁、镁、钴、铝氧化物。有机有色色素包括但不限于D&C红No.36、D&C橙No.17、D&C红Nos.7,11,31和34钙色淀、D&C红No.12钡色淀、D&C红No.13锶色淀、FD&C黄No.5铝色淀和炭黑粒子。惰性粒子包括但不限于碳酸钙、硅酸铝、硅酸钙、硅酸镁、云母、滑石、硫酸钡、硫酸钙、粉末尼龙(powdered NylonTM)、全氟化烃和其他惰性塑料。
丝蛋白也可用于牙线(例如,见US 2005/0161058)。该线可为单丝线或多丝线,纤维可以扭曲也可以不扭曲。牙线可包装成单个或包装成带有切割工具可切割成任意长度的卷。牙线可提供成除丝状之外的许多形状,例如但不限于贴或片之类。该线可包被不同的材料,例如但不限于蜡、牙线用聚四氟乙烯单纤丝。
丝蛋白也可用于肥皂(如,见US 2005/0130857)。
色素和化妆品粒子包被
用于色素和化妆品粒子包被有效量的丝蛋白此处定义为相对于干重粒子的约10-4到约50%,但优选地从约0.25到约15%的重量比例。所用的最优丝蛋白量取决于要包被色素或化妆品粒子的类型。例如无机有色色素的丝蛋白用量优选地在约0.01%到20%重量之间。对于有机色素,优选的丝蛋白量在约1%到约15%重量,而对于惰性粒子,优选的量在约0.25%到约3%重量。US 5,643,672中描述了制备包被色素和粒子的方法。这些方法包括:在搅拌混合的同时加入丝蛋白水溶液,形成丝蛋白和该粒子的浆并干燥,喷雾干燥丝蛋白溶液到粒子上或低压冻干丝蛋白和粒子浆。包被的色素和化妆品颗粒可用于化妆品组分、油漆、墨水之类。
生物医学
丝蛋白可用于包被绷带以促进伤口愈合。为此,绷带材料用有效量的丝蛋白包被。对于伤口愈合绷带的目的,有效量的丝蛋白此处定义为相对于绷带材料重量的约10-4到约30%的重量比例。要包被的材料可为任何柔软的、生物惰性的、多孔的布或纤维。例子包括但不限于棉、丝、人造丝、醋酸盐、丙烯酸树脂、聚乙烯、聚酯及其组合。布或纤维的包被可通过许多本领域已知的方法完成。例如,被包被的材料浸入含有丝蛋白的水溶液中。另外,包括丝蛋白的溶液也可使用喷枪喷洒到要包被材料的表面上。此外,包括丝蛋白的溶液也可通过滚动包被印刷方法包被到表面上。伤口绷带可包括其他添加剂,包括但不限于消毒剂如碘、碘化钾、碘化聚烯吡酮、利凡诺、过氧化氢、苄烷铵氯化物、醋酸氯己啶;加速治愈剂如尿囊素、盐酸狄布卡因和苹果酸氯化苯胺;收缩血管剂如盐酸萘甲唑啉;收敛剂如氧化锌;和结痂剂如硼酸。
本发明丝蛋白也能以薄膜的形式用作伤口敷料。US 6,175,053描述了丝蛋白以无定形薄膜的形式用作伤口敷料。无定形薄膜包括结晶度低于10%的致密无孔且包括有效量丝蛋白的膜。对于创伤护理的膜,有效量丝蛋白此处定义为约1到99%重量比例。该膜也可包括其他成分包括但不限于其他蛋白如丝胶蛋白和消毒剂、加速治愈剂、收缩血管剂、收敛剂和结痂剂,如上面所述。其他蛋白如丝胶蛋白可包括1到99%组合物重量。所列其他物质的总量优选地低于约30%重量,更优选地在约0.5到20%组合物重量。伤口敷料薄膜可通过在水溶液中溶解上述材料,通过过滤或离心去除不溶物,将溶液浇铸到光滑固体表面如丙烯酸盘,然后干燥。
本发明丝蛋白也可用于缝合(如,见US 2005/0055051)。该缝合的特征是用超高分子量纤维和丝纤维做成编织套。聚乙烯提供强度。聚酯纤维和高分子量的聚乙烯编织在一起而提供了改良的拴系特性。该丝可用对比色以提供改良的缝合识别和鉴定痕迹。丝比其他纤维更能和组织的相适应,允许在靠近打结的地方剪掉末端而不必担心缝合末端和周围组织的有害相互作用。高强度缝合线的处理特性也可通过使用不同材料包被缝合线而得到增强。该缝合线有利具有Ethibond 5号线的强度,而其直径、感觉和拴系能力和2号缝合线一样。因此,该缝合线对于大部分整形外科操作,如旋转套修复术、跟骨腱修复术、髌韧带修复术、ACL/PCL重建、肩臀重建操作,以及代替用于缝合锚中以及和缝合锚一起使用的缝合线来说是理想的。该缝合线可不包被,或用蜡(蜂蜡、石油蜡、聚乙烯蜡或其他)、硅酮(Dow Corning硅酮流体202A或其他)、硅酮橡胶、PBA(聚丁酸)、乙基纤维素(Filodel)或其他包被物包被,以改善编织物的润滑性、结安全性或耐磨性等等。
本发明丝蛋白也可用于支架(如,见US 2004/0199241)。例如,支架移植物包括管腔内支架和移植物,其中支架移植物包括丝。该丝诱导接受支架移植物的宿主的应答,而该应答能使丝支架移植物与接近丝支架移植物的丝的组织之间的粘连增强。所述的丝可通过多种方法中的任何一种结合到移植物上,例如,通过将丝交织到移植物上或通过附着到移植物上(例如通过粘合剂或缝合的方法)。丝的形式可以为线、穗带、片层、粉末等等。对于丝在支架移植物上的位置,可仅附着到支架的表面,和/或附着到支架移植物的远端区,以协助远端区固定在宿主中的邻近组织。在本发明的背景中可使用多种支架移植物,取决于所需治疗的位置和性质。支架移植物可以是,例如分叉的或管状移植物、圆柱状或逐渐变细、可自展或球形展开的、单片或组件等等。
除了丝以外,支架移植物可在一些或所有丝上进行包被,其中该包被在支架移植物插入宿主时降解,因此该包被延缓丝和宿主之间接触的时间。适当的包被包括而不限于明胶、可降解聚酯(例如PLGA、PLA、MePEG-PLGA、PLGA-PEG-PLGA及其共聚物和掺和物)、纤维素和纤维素衍生物(例如羟丙基纤维素)、多糖(例如透明质酸、葡聚糖、硫酸葡聚糖、壳聚糖)、脂质、脂肪酸、糖脂、核酸酯、聚酐、多正酯类和聚乙烯醇(PVA)。含丝的支架移植物可包括生物活性剂(药物),其中该制剂从支架移植物中释放而后诱导增强的细胞应答(例如,细胞或细胞外基质沉淀)和/或插入支架移植物宿主的纤维变性反应。
本发明丝蛋白也可用于体外生产韧带和腱的基质中(例如,见US2005/0089552)。多能细胞,如骨髓基质细胞(BMSCs)种植在丝纤维基质中。生物工程韧带或腱的有利特点是在应用机械力方向上的细胞定向和/或基质卷曲模式,以及若施加了机械力,沿着该机械力或刺激所产生的机械负荷的轴上产生的韧带和腱特异性标记包括胶原I型、胶原III型和纤连蛋白。在一个优选实施方式中,所述的韧带或腱的特点是螺旋组织排列的纤维束。一些能够生产的韧带或腱的例子包括前十字韧带、后十字韧带、回旋肌腱群、肘和膝的内侧副韧带、手的屈肌腱、踝的外侧韧带以及颌和颞颌关节的腱和韧带。本发明可生产的其他组织包括软骨(关节和半月板都包括)、骨、肌肉、皮肤和血管。
本发明丝蛋白也可用于水凝胶(例如,见US 2005/0266992)。丝心蛋白水凝胶具有开孔结构特征,使它们可在细胞培养、伤口和烧伤敷料、软组织替代物、骨赋形剂中用作组织工程支架和底物,以及药学或生物学活性化合物的支持物。
所述的丝蛋白也可用于皮肤病学组合物(例如,见US 2005/0019297)。此外,本发明丝蛋白及其衍生物也可用于持续释放组合物(例如,见US 2004/0005363)。
纺织
本发明丝蛋白也可用于纤维表面而后用于纺织中。这将在纤维上提供单层蛋白膜而产生光滑产品。US 6,416,558和US 5,232,611描述了加入抹光包被到纤维上。这些揭示中描述的方法提供了多种抹光纤维以提供良好感觉和光滑表面的例子。用于这种用途时,使用有效量丝蛋白包被纤维。为用于纺织中包被纤维的目的,有效量丝蛋白此处定义为相对于纤维材料重量的约1到约99%重量比例。纤维材料包括但不限于棉纺织纤维、聚酯如人造丝和LycraTM、尼龙、毛织物和其他天然纤维包括土丝。适合将丝蛋白用于纤维上的组合物可包括助溶剂如乙醇、异丙醇、己芴醇(hexafluoranols)、异硫代氰酸盐(isothiocyanouranates)和其他能够和水混合形成溶液或微乳化液的极性溶剂。包括丝蛋白的溶液可喷到纤维上或将纤维浸到溶液中。尽管不是必须的,包被材料优选地进行快速干燥。另一种方案是将丝蛋白组合物应用到编织纤维上。该应用理想的实施方式为将丝蛋白用于包被可伸展的编织物如用于长袜。
复合材料
丝纤维可加入到聚氨酯、其他树脂或热塑性填充物中制备面板和其他建筑材料或替代木材和颗粒板用模型器具和台阶顶(benchtop)。该复合材料也可用于建筑和汽车制造特别是屋顶和门板。丝纤维增强树脂使该材料更强且允许与其他颗粒板和组合材料相比相同或更高强度而重量轻的构造。丝纤维可分离并加入合成的形成复合材料的树脂中或与从植物中获得的蛋白质、淀粉和油联合使用以生产生物复合材料。JP 2004284246、US 2005175825、US 4,515,737、JP 47020312和WO 2005/017004描述了生产这种材料的方法。
纸添加物
本发明的丝的纤维性质可增加造纸的强度和品质结构。通过棉浆中斑纹丝线制作的丝纸,以制备超平滑手工纸,可用于礼品包装、笔记本封面、纸袋中。JP2000139755中一般描述了生产包括本发明丝蛋白纸制品的方法。
高级材料
本发明的丝具有相当的韧性,并且变湿的时候在维持这些性质方面与其他丝不同(Hepburn等人,1979)。
服装纺织工业的技术和智能纺织领域具有实质性的增长。对健康、高功能值、环境友好型和个人化的织品需求越来越多。如本发明所述的纤维在变湿的时候不改变其性质,特别是维持了它们的强度和伸展性,可用于运动休闲的功能性服装以及工作服和保护服装中。
武器和监视技术的发展促进了个人防护设备和战场相关系统和结构的创新。除了可满足常规需要,如长时间暴露的耐用性、重型服装和对外部环境的保护之外,本发明丝织品可加工成抗发射物冲击、火和化学品的织品。WO 2005/045122和US 2005268443描述了生产上述材料的方法。
实施例
实施例1-晚末龄幼虫唾液腺cDNA的制备和分析
在真针尾类和脉翅目昆虫(意大利蜂(Apis mellifera)、授粉熊蜂(Bombusterrestris)、牛头犬蚁(Myrmecia foricata)、黄猄蚁(Oecophylla smaragdina)、玛草蛉(Mallada signata))丝中发现的蛋白通过将胰蛋白酶消化该丝,获得多肽的离子阱连续质谱(MS/MS)片段模式与从晚末龄幼虫唾液腺中分离的cDNA编码蛋白的预测质谱数据进行匹配来鉴定。为确定通过这种方法对蜜蜂进行分析时不遗漏任何蛋白,肽质谱分析数据也和蜜蜂基因组计划预测的,以及Amel3蜜蜂基因组序列所有六个读码框翻译的意大利蜂(Apis mellifera)蛋白质的虚拟胰蛋白酶消化产物相比较。
蜜蜂
意大利蜂(Apis mellifera)幼虫从驯养蜂房中得到。以前研究表明意大利蜂丝的产生限制在末龄幼虫后半段时的唾液腺中(Silva-Zacarin等人,2003)。在此阶段,RNA在该腺的后端更丰富(Flower和Kenchington,1967)。从浸在磷酸盐缓冲盐水中晚五期蜜蜂幼虫中分离50个唾液腺的立方形细胞区。分离唾液腺的后端立即放入(Ambion,Austin,TX,USA)中以稳定mRNA,然后保存在4℃。
使用Ambion(Austin,TX,USA)公司PCR试剂盒RNAqueous从晚末龄幼虫唾液腺中分离总RNA(35μg)。使用Invitrogen(Calsbad,CA,USA)Micro-FastTrackTM2.0mRNA分离试剂盒按制造商说明从总RNA中分离信使RNA,分离的mRNA洗脱到10μl无RNAse水中。
使用Invitrogen(Calsbad,CA,USA)CloneMinerTM cDNA文库构建试剂盒用从蜜蜂幼虫中分离的mRNA构建cDNA文库,对标准方案进行下述修改:第一条链合成,6pmol.μl-1生物素-attB2-Oligo(dT)引物0.5μl及每种2mM dNTPs 0.5μl加入到10μl mRNA中。65℃温育5min然后45℃2min,加入2μl 5×第一条链缓冲液,1μl 0.1M DTT,以及0.5μl 200U.μl-1SuperscriptTM II RT。对于第二条链合成,所有试剂的总体积减半,乙醇沉淀后,用5μl DEPC处理水重悬浮cDNA。aatB1接头(1μl)在总体积10μl中连接,其中5μl cDNA,2μl 5×接头缓冲液,1μl 0.1M DTT以及1μlT4 DNA连接酶(1U.μl-1),在16℃连接48hrs,16小时候额外加入0.5μl T4 DNA连接酶(1U.μl-1)。按照制造商说明根据cDNA大小进行分选,对300-500μl样品进行洗脱,乙醇沉淀,重悬浮并转化入大肠杆菌DH10BTM T1抗噬菌体细胞中,如推荐的那样。cDNA文库包括大约1,200,000集落形成单位(cfu),带有大约1%原载体。平均插入大小为1.3±1.4kbp。
随机挑选82个集落,使用GenomeLabTM DTCS Quick start试剂盒(BeckmanCoulter,Fullerton CA USA)在CEQ8000Biorad测序仪上测序。其聚类到54个组(表2)。编码丝蛋白的cDNA的鉴定如下所述。
其他物种
使用Ambion(Austin,TX,USA)公司PCR试剂盒RNAqueous从晚末龄幼虫唇腺中从下述物种中分离总RNA:4熊蜂(授粉熊蜂,Bombus terrestris)(2μg RNA)、4牛头犬蚁(Myrmecia forficata)(3μg RNA)约100织工蚁(黄猄蚁,Oecophyllasmaragdina)(0.4μg RNA)和约50绿草蜻蛉(玛草蛉,Mallada signata)。使用Invitrogen(Calsbad,CA,USA)Micro-FastTrackTM 2.0mRNA分离试剂盒从总RNA中分离mRNA,溶入终体积10μl水中。使用Invitrogen(Calsbad,CA,USA)CloneMinerTM cDNA试剂盒用从mRNA构建cDNA文库,对标准方案进行下述修改:第一条链合成,3pmol生物素-attB2-Oligo(dT)引物及1nmol每种dNTPs加入到10μl mRNA中。65℃温育5min然后45℃2min,加入2μl 5×第一条链缓冲液,50nmol DTT,以及100U SuperscriptTM II RT。
表2.蜜蜂末龄唾液腺cDNA以及SDS处理巢房丝胰蛋白酶消化肽的MS离子阱片段模式
Figure A20068004566600411
对于第二条链合成,所有试剂的总体积根据制造商推荐量减半,乙醇沉淀后,用5μl DEPC处理水重悬浮cDNA。aatB1接头(1μl)在总体积10μl中连接,其中5μlcDNA,2μl 5×接头缓冲液,50nmol DTT,以及1U T4DNA连接酶,在16℃连接12hrs。cDNA文库包括大约2.4×107(熊蜂),5.0×107(牛头犬蚁)和6000(绿蚂蚁)集落形成单位(cfu),带有对于牛头犬蚁和熊蜂文库低于1%以及在绿蚂蚁文库中大于80%原载体。文库中平均插入大小为1.3Kbp。
序列数据从熊蜂和牛头犬蚁cDNA文库中多于100个随机克隆、蜜蜂82个克隆及草蜻蛉60个克隆中获得。从绿蚂蚁(大约1mm长)中获得唾液腺存在技术困难,降低了该物种文库的效率,因而仅检查了40条序列。表3提供了所鉴定的丝蛋白的总结。
表3.真针尾类丝蛋白的鉴定和特性
物种 蛋白名称   蛋白长度(氨基酸)   %cDNA文库克隆 不同总计MS/MS检索分值   %螺旋结构**   MARCOIL预测的卷曲螺旋长度***(氨基酸)
  蜜蜂   AmelF1*   333   6   52   76   117
  蜜蜂   AmelF2*   290   7   51   88   175
  蜜蜂   AmelF3*   335   11   107   81   154
  蜜蜂   AmelF4*   342   7   88   76   174
  蜜蜂   AmelSA1*   578   13   40   41   45
  大黄蜂   BBF1   327   4   180   86   147
  大黄蜂   BBF2   313   14   100   84   199
  大黄蜂   BBF3   332   20   218   86   146
  大黄蜂   BBF4   357   32   137   80   188
  大黄蜂   BBSA1   >501   3   138   21   0
  牛头犬蚁   BAF1   422   16   99   69   121
  牛头犬蚁   BAF2   411   30   90   76   132
  牛头犬蚁   BAF3   394   26   88   79   131
  牛头犬蚁   BAF4   441   24   116   76   157
  织工蚁   GAF1   391   35   228   74   177
  织工蚁   GAF2   400   22   191   79   158
  织工蚁   GAF3   395   13   156   72   103
  织工蚁   GAF4   443   17   148   74   166
  草蜻蛉   MalF1   596   23   45   89   151
*此处也分别称为Xenospira1-4和Xenosin,**PROFsec预测,***MARCOIL以90%阈值预测
实施例2土丝的制备和蛋白分析
去除幼虫后的蜜蜂巢房、去除幼虫后的熊蜂茧、去除幼虫后的的牛头犬蚁茧或织工蚁丝层在温水中广泛洗三次去除水溶性污染物,然后在用氯仿广泛洗三次除蜡。通过蒸馏水淋洗除氯仿,保留一团所述的丝用于分析。一团膜翅目昆虫(蚂蚁和蜜蜂)丝样品进一步在0.05%煮沸碳酸钠溶液中洗涤30分钟,这是蚕茧丝脱胶的标准程序,然后用蒸馏水淋洗。草蜻蛉丝仅用蒸馏水淋洗。一团草蜻蛉丝样品通过在0.05%碳酸钠溶液煮沸30分钟脱胶。
一团蜜蜂材料在2%SDS 95℃浸湿过夜,然后用蒸馏水淋洗三次。热SDS溶液提取溶解了大部分蛋白,但丝层保持了其构象。
清洁的丝通过液相层析,然后通过串联质谱(LCMS)分析,如下所述。
清洁的丝团放在Millipore′zipplate′96孔微滴定板的孔中,该板的每个孔包括通过该孔底部的C18反相层析介质栓塞,并在其中加入20μl 25mM含有160ng测序级纯胰蛋白酶(Promega)的碳酸氢铵溶液。然后该板在30℃增湿塑料袋中温育过夜。
通过在每个孔的边上吸入乙腈(10μl)润湿C18材料,在37℃保温该板15分钟。每孔中加入甲酸溶液(130μl,1%v/v),30分钟后,通过逐渐降低真空从板底缓慢抽吸每个孔的溶液收获C18材料上的消化蜜蜂蛋白的肽。通过抽吸100μl甲酸溶液两次洗涤C18材料。通过直接加入C18材料中6μl 1%甲酸加入70%甲醇后立即离心,将肽通过C18栓塞洗脱到下面的微滴定板中。该板置入真空中,直到通过蒸发每孔中的体积降低约2倍。每孔中加入甲酸溶液(10μl),并将该板转移到Agilent 1100毛细管液相层析系统的孔板取样器中。
丝提取物中的肽(8μl)结合到Agilent Zorbax SB-C185μm 150×0.5mm柱中,以0.1%甲酸/5%乙腈20μl.min-11分钟然后用逐渐增加乙腈浓度到0.1%甲酸/20%乙腈的梯度5μl.min-1洗脱超过1分钟,然后到0.1%甲酸/50%乙腈超过28分钟,然后到0.1%甲酸/95%乙腈超过1分钟。该柱子通过0.1%甲酸/95%-100%乙腈以20μl.min-1洗超过5分钟,并下一孔样品肽上样前以0.1%甲酸/5%乙腈重平衡7分钟。
柱中的洗脱物通过仪器的电喷雾离子源微喷雾器引入Agilent XCT离子阱质谱仪中。简单的说,当肽从柱中洗脱时,离子阱收集全谱阳性离子扫描(100-2200m/z),然后两次MS/MS扫描在全谱扫描中观察到的离子,避免选择带有单电荷的离子。当选定进行MS/MS分析的离子后,所有其他离子都从离子阱排除,选定的离子根据仪器推荐的″SmartFrag″和″Peptide Scan″设置片段化。一旦收集到任何特定m/z值的两个片段谱,其在另外30秒被排除在选定的分析外,以避免收集冗余数据。
整个实验的质谱数据组使用Agilent′s Spectrum Mill软件分析,与从cDNA文库中预测的蛋白序列数据匹配。软件产生实验观察到的肽片段质量组与根据提供的数据库中蛋白序列可能产生的预测片段之间每个匹配质量的得分值。此处报告所有序列匹配的得分大于20,这是自动有把握接受有效匹配的缺省设置。
本分析鉴定出五种唇腺中高水平表达的蛋白质与来源于每个蜜蜂种同源的丝匹配(如表2和表3所示),以及四种唇腺中到水平表达的蛋白质与来源于每个蚂蚁种同源的丝匹配(如表3所示)。幼虫唇腺中编码这些蛋白的信使RNA丰度与所产生蛋白的丰度一致(信使的丰度如表3所示)。
为保证通过这种鉴定方法没有遗漏任何蜜蜂丝蛋白,我们也将蜜蜂丝胰蛋白酶肽质谱数据与一组公众可获得的蜜蜂基因组计划预测的蛋白序列相比较,其通过计算机算法为努力识别蜜蜂全部基因组DNA序列中可转录的基因而产生。此外,我们根据蜜蜂基因组计划提供的每个连续的基因组DNA序列的六个可能的读码框产生翻译数据库(Amel3公布)。这些翻译的DNA序列呈现到Spectrum Mill软件,如同它们是非常大的蛋白质序列一样。匹配MS/MS肽数据鉴定出编码部分分离的蜜蜂蛋白质的基因组序列内的开放读码框,而不必首先预测基因的组织。通过这种方法没有鉴定出丝中另外的蛋白。
实施例3-土丝的结构分析
土丝样品如实施例2描述的进行制备。丝样品通过带有Pike Miracle钻石衰减全反射附件的Bruker Tensor 37傅立叶变换红外光谱仪检查。对蜜蜂、熊蜂、绿蚂蚁、牛头犬蚁和草蜻蛉幼虫丝(图1)的酰胺I区、II区光谱分析表明所有这些丝都有主要的α螺旋二级结构。真针尾类的丝具有在FT-IR光谱1645-1646cm-1处的优势峰,比经典的α螺旋信号向下移动大约10cm-1并加宽。这种α螺旋信号的移动是典型的卷曲螺旋蛋白(Heimburg等人,1999)。脱胶样品的光谱没有发生变化。
实施例4-土丝的氨基酸组成与鉴定的丝蛋白十分相似
土丝的氨基酸组成通过使用Australian Proteome Analysis Facility Ltd(Macquarie University,Sydney)的Waters AccQTag化学110℃气相水解24小时后确定。
测得的SDS洗涤丝的氨基酸组成与鉴定的丝蛋白序列预测的相似(图2和3)。
实施例5-丝蛋白结构分析
预测的分泌肽
如对丝蛋白预期的一样,使用两个模型鉴定信号肽的SignalP 3.0信号预测程序(Bendtsen等人,2004)预测所有鉴定的编码蛋白的丝基因包括将它们从细胞中定向分泌的信号肽(数据未示)。该多肽预测的切割位点如下:
Xenospira1(AmelF 1)-在pos 19和20(ASA-GL)之间,
Xenospira2(AmelF2)-在pos 19和20(AEG-RV)之间,
Xenospira3(AmelF3)-在pos 19和20(VHA-GV)之间,
Xenospira4(AmelF4)-在pos 19和20(ASG-AR)之间,
Xenosin(AmelSA1)-在pos 19和20(VCA-GV)之间,
BBF1-在pos 19和20(ASA-GQ)之间,
BBF2-在pos 20和21(AEG-HV)之间,
BBF3-在pos 19和20(VHA-GS)之间,
BBF4-在pos 19和20(ASA-GK)之间,
BAF1-在pos 19和20(ASA-SG)之间,
BAF2-在pos 19和20(ASG-RV)之间,
BAF3-在pos 19和20(ASG-NL)之间,
BAF4-在pos 19和20(VGA-SE)之间,
GAF1-在pos 19和20(ADA-SK)之间,
GAF2-在pos 19和20(ASG-GV)之间,
GAF3-在pos 19和20(ASG-GV)之间,
GAF4-在pos 19和20(VGA-SE)之间,
MalF1-在pos 26和27(SST-AV)之间。
蚂蚁所有的四种和蜜蜂五种丝蛋白中的四种丝蛋白是螺旋的并具有卷曲螺旋结构。
蛋白模型和模式识别算法的结果证实大部分鉴定的蜜蜂丝蛋白是形成卷曲螺旋的螺旋蛋白。
PROFsec(Rost和Sander,1993)和NNPredict(McClelland和Rumelhart,1988;Kneller等人,1990)算法被用于研究鉴定的丝基因的二级结构。这些算法鉴定出Xenospira1[GB 12184-PA](SEQ ID NO:1)、Xenospira2[GB 12348-PA](SEQ IDNO:3)、Xenospira3[GB17818-PA](SEQ ID NO:5)和Xenospria4[GB19585-PA](SEQID NO:7)是高度螺旋蛋白,具有76-85%之间的螺旋结构(表4)。Xenosin[GB15233-PA](SEQ ID NO:10)具有显著少的螺旋结构。
表4.PROFsec(Rost和Sander,1993)预测的意大利蜂丝蛋白二级结构显示螺旋、延伸片层和环的百分数
更多的蛋白模型和模式识别算法的结果证实大部分鉴定的蜜蜂丝蛋白是形成卷曲螺旋的螺旋蛋白。PredictProtein(Rost等人,2004)算法被用来研究鉴定丝基因的二级结构。这些算法鉴定出Xenospira1(SEQ ID NO:1)、Xenospira2(SEQ IDNO:3)、Xenospira3(SEQ ID NO:5)、Xenospira4(SEQ ID NO:7)、BBF1(SEQ IDNO:22)、BBF2(SEQ ID NO:24)、BBF3(SEQ ID NO:26)、BBF4(SEQ ID NO:28)、BAF1(SEQ ID NO:40)、BAF2(SEQ ID NO:42)、BAF3(SEQ ID NO:44)、BAF4(SEQID NO:46)、GAF1(SEQ ID NO:56)、GAF2(SEQ ID NO:58)、GAF3(SEQ ID NO:60)、GAF4(SEQ ID NO:62)和MalF1(SEQ ID NO:72)是高度螺旋蛋白,具有69-88%之间的螺旋结构(表3)。AmelSA1[GB15233-PA](Xenosin)(SEQ ID NO:10)和BBSA1(SEQ ID NO:30)具有显著少的螺旋结构。
螺旋蛋白的超螺旋(卷曲螺旋)来自于一般记为(abcdefg)n的特征性七肽重复序列,a和d位残基一般为疏水残基,剩余位置一般为带电或极性残基。模式识别程序(MARCOIL(Delorenzi和Speed,2002)、COILS(Lupas等人,1991))在Xenospira1[GB12184-PA](SEQ ID NO:1)、Xenospira2[GB12348-PA](SEQ ID NO:3)、Xenospira3[GB17818-PA](SEQ ID NO:5)和Xenospira4[GB19585-PA](SEQ IDNO:7)(MARCOIL:表5,COILS:图4),以及BBF1(SEQ ID NO:22)、BBF2(SEQID NO:24)、BBF3(SEQ ID NO:26)、BBF4(SEQ ID NO:28)、BAF1(SEQ ID NO:40)、BAF2(SEQ ID NO:42)、BAF3(SEQ ID NO:44)、BAF4(SEQ ID NO:46)、GAF1(SEQID NO:56)、GAF2(SEQ ID NO:58)、GAF3(SEQ ID NO:60)、GAF4(SEQ ID NO:62)和MalF1(SEQ ID NO:72)(MARCOIL:表3)中鉴定出无数的卷曲螺旋典型的七肽重复。
蜜蜂丝蛋白中一种新的卷曲螺旋序列的鉴定
在Xenospira1[GB 12184-PA]、Xenospira2[GB 12348-PA]、Xenospira3[GB17818-PA]、Xenospria4[GB19585-PA]序列中鉴定出的七肽氨基酸残基重复每个都高度指示一种卷曲螺旋二级结构(图5)(置信水平见表5)。发现的七肽数目众多并且连续暗示该蛋白采取一种非常规则的结构。在两种蜜蜂蛋白中鉴定出了重叠的多肽:Xenospira1的主要卷曲螺旋区包括有3个残基偏移的重叠七肽,接着有5个残基的空隙,然后是4个连续的七肽;Xenospira2整个卷曲螺旋区有多个重叠七肽,有一个单个偏移和4个残基偏移(相当于3个残基偏移)。主要七肽不同位置的氨基酸组成显示在表6的第一栏,重叠七肽的位置显示在邻近的栏里。
表5.MARCOIL(Delorenzi和Speed,2002)模式识别算法预测的鉴定丝蛋白中以卷曲螺旋存在的残基百分数。
Figure A20068004566600461
令人惊奇的是当集中起来看时主要七肽具有新颖的组成——在“疏水”七肽位a和d具有非同寻常高含量的丙氨酸(见表6和图5)。另外,很大比例的七肽在同一个七肽内部的a和d两个位置都是丙氨酸(Xenospira1[GB12184-PA]中33%;Xenospira2[GB12348-PA]中36%;Xenospira3[GB17818-PA]中27%以及Xenosρira4[GB19585-PA]中38%;见表6和7)。
表6.蜜蜂丝蛋白卷曲螺旋区不同七肽位置每种氨基酸残基数目的总结。
Figure A20068004566600471
表7.蜜蜂丝蛋白七肽中丙氨酸残基的总结。
蛋白质 螺旋结构数量(%)1 主要七肽数目   主要七肽中蛋白数量(%)  主要七肽中Ala的数量(%) 主要七肽中a位Ala的数量(%) 主要七肽中d位Ala的数量(%) 主要七肽在中a和d位Ala的数量(%)
  Xenospira1   77(70)   27  41   44   74   33
  Xenospira2   85(82)   28  37   71   57   36
  Xenospira3   80(73)   30  37   63   43   27
  Xenospira4   77(69)   29  48   79   58   38
  Xenosin   41(41)  n/a   n/a   n/a   n/a
1PROFsec预测,NNPredict的预测显示在括号中。
图6和图7总结了膜翅目丝卷曲螺旋区中不同七肽位置的氨基酸组成。如上所述,七肽内的位置具有新颖的组成——蜜蜂和蚂蚁丝的“疏水”七肽位置a和d包括非常高水平的丙氨酸(平均58%)以及高水平的极性残基(平均21%),相对于其他卷曲螺旋来说。此外,e位非同寻常的小并疏水(表8、图7)。该位置在七肽地形上位于a位残基邻近。a和d位残基的组成相似性暗示该丝采取每个α螺旋三个核心残基的卷曲螺旋结构。核心中三个残基核心比两个残基贡献更大的疏水界面(Deng等人,2006)——这一特征将有助于卷曲螺旋的形成和稳定性。
此外,集中看来七肽内b、c、e、f和g位比以前确定的蛋白卷曲螺旋区一般更为疏水,极性更小且带电更少(见图7,表8和9)。因此,尽管历史上认为有刺的膜翅目昆虫丝的螺旋含量是甘氨酸含量降低和酸性残基成分的增加导致的(Rudall and Kenchington,1971),我们发现并非甘氨酸/酸性残基决定了新颖的丝结构,而是多肽链中丙氨酸残基的位置决定的。
表8.直系同源膜翅目丝蛋白和绿草蜻蛉丝蛋白(MalF1)的每个七肽位的平均大小和疏水性显示a、d和e位(核心)比其他位置更小且更疏水。有些例子中,b位(部分浸水)也小且疏水。
实施例6-蜜蜂丝蛋白似乎是广泛交联的
蜜蜂丝蛋白都包括高含量的赖氨酸(6.5%-16.3%)。比较测定的蜜蜂丝氨基酸组成和鉴定的丝蛋白的序列显示赖氨酸残基数目的大量不匹配,在丝中检测到的赖氨酸比预期的要少很多(图2和3)。这暗示丝中赖氨酸残基被修饰了,所以通过标准的氨基酸分析不能鉴定出来。已知赖氨酸形成多种交联:或者被赖氨酸氧化酶催化的酶交联,或者糖化赖氨酸残基产生的非酶交联(Reiser等人,1992)。蜜蜂和熊蜂丝氨基酸分析中赖氨酸的低代表性与存在的赖氨酸交联一致。
表9.丝蛋白卷曲螺旋区不同七肽位置每类氨基酸中残基的数目
Figure A20068004566600501
共价交联的蛋白SDS聚丙烯酰胺胶电泳(PAGE)预期交联复合体的分子量迁移。我们对晚末龄蜜蜂唇腺蛋白SDS PAGE并测量相对于标准蛋白标记的丝蛋白迁移。每个鉴定的丝蛋白单体都观察到了相应的带,然而含有这些蛋白的高分子量带也存在,如在交联系统中所预期的那样(图8)。
如上所述,蜜蜂唇腺包括有组织和无组织丝蛋白的混合物。观察到的交联蛋白可能相应于该腺的前端区蛋白群,该丝即从那里挤出。有理由推测细胞外蜜蜂丝包括大量高比例交联蛋白,比在所有阶段唾液腺丝蛋白异源混合物中观察到的比例要高。键似乎不是半胱氨酸交联,因为还原性处理对该丝没有影响,且鉴定的丝蛋白中包括很少或没有半胱氨酸残基。
实施例7-真针尾类丝蛋白与其他丝蛋白显著不同
真针尾类丝与其他所描述的丝基因在氨基酸组成(表10)、涉及蛋白的分子量、二级结构和物理性质(表11和12)方面显著不同。鳞翅类丝主要由小氨基酸残基丙氨酸、丝氨酸和甘氨酸组成(例如家蚕,表10),并且支配性的二级结构是广泛的β片层。粉蝶盘绒茧蜂(Cotesia glomerata)含有大量天冬酰胺和丝氨酸——大量的后一残基是鳞翅目丝胶蛋白(丝胶)的特征(表10)。粉蝶盘绒茧蜂(Cotesiaglomerata)的丝蛋白模型并没有在二级结构中鉴定出螺旋或卷曲螺旋。相比之下,蜜蜂、蚂蚁和草蜻蛉的丝富含丙氨酸(表10),包括形成卷曲螺旋的高水平的螺旋二级结构。
表10.不同昆虫丝的氨基酸组成,最多的残基以黑体显示。
  蜜蜂   真针尾类丝   玛草蛉丝   粉蝶盘绒茧蜂   家蚕
 丙氨酸   22.6   27.5   26.9   12.5   29.3
 谷氨酸+谷氨酰胺   16.1   13.9   7.4   0.6   0.9
 天冬氨酸+天冬酰胺 13.2 8.6 15.0   37.6(Asn 33.7) 1.2
 丝氨酸   10.4   11.5   8.5   37.1   11.3
 亮氨酸   9.0   7.2   5.9   0.4   0.4
 缬氨酸   6.6   4.8   4.1   0.3   2.1
 甘氨酸   5.7   6.6   11.2   5.5   46.0
 异亮氨酸   5.6   4.0   3.9   0.4   0.6
 苏氨酸   5.1   4.9   5.3   0.5   0.8
 赖氨酸   3.7   3.7   3.2   0.1   0.3
 苯丙氨酸   2.0   1.0   0.5   0.5   0.6
 酪氨酸   0   0.9   0.5   3.1   5.3
 脯氨酸   0   0   0   0.7   0.4
 组氨酸   0   0.5   0.5   0.4   0.2
 精氨酸   0   3.3   5.4   0.2   0.4
 甲硫氨酸   0   1.0   1.6   0   0.1
 色氨酸 0   未报道   未报道   未报道 0.2
 半胱氨酸 0 0.4   0.3 未报道 0.1
表11.昆虫丝之间的不同
  蚂蚁和蜜蜂丝   玛草蛉丝   盘绒茧蜂种   鳞翅目例如家蚕
最多的氨基酸   Ala   Ala   Ser,Asn   Gly,Ala
丝心蛋白大小   25-35kDa   57KDa   约500KDa   >100KDa
  二级结构   卷曲螺旋   卷曲螺旋   十分可能是β片层,二级结构预测程序PROFsec和MACOIL没有识别出任何螺旋结构或卷曲螺旋区。   与β折叠、β螺旋、α螺旋和无定形区松散关联的β折叠层
表12.昆虫丝的溶解性
Figure A20068004566600521
四种膜翅目物种丝蛋白卷曲螺旋区支序分析(图9)暗示该基因在真针尾类从寄生蜂分化前由共同的祖先进化而来。该丝的序列广泛分化,我们仅能比对组成每个蛋白卷曲螺旋区的210个氨基酸。此处提供的每个丝蛋白卷曲螺旋区之间的氨基酸序列同源性显示在表13,且相应区的DNA同源性显示在表14。尽管所述的蛋白质氨基酸含量(特别高水平的丙氨酸)和三级结构相似,主要氨基酸序列的同源性非常低。事实上,编码玛草蛉丝蛋白的基因是独立进化的,因此丝蛋白序列不能和膜翅目序列相比对。这表明氨基酸的同源性可出现相当大的变化,而不影响该蛋白的生物功能。
支序分析预测真针尾蜂的丝包括蚂蚁和蜜蜂丝相关蛋白,尽管这些蛋白与此处描述的蛋白有相似的组成和结构,它们具有高度分化的主序列。
此处提供的丝蛋白氨基酸序列(图10)和蛋白数据库相比较,然而,没有发现具有合理水平序列同源性的(例如丝蛋白序列长度上不大于30%同源性)任何现有技术蛋白。
表13.蚂蚁和蜜蜂中纤维蛋白卷曲螺旋区蛋白序列间同源性百分数。
表14.蚂蚁和蜜蜂中纤维蛋白编码卷曲螺旋区核苷酸序列之间的同源性百分数。
编码这些丝蛋白(图11所提供的)的开放读码框按上述方法进行相似的数据库检索。鉴定出的仅有的相关分子是作为蜜蜂基因组计划的一部分发表的(www.ncbi.nlm.nih.gov/genome/guide/bee)。蜜蜂基因组计划已经预测了开放读码框,然而并没有提示编码蛋白的功能。此外,对于任何这些分子,没有证据表明曾经产生过包括该mRNA开放读码框的多核苷酸。
编码Xenospira1、Xenospira2、Xenosρira3和Xenospira4的基因包括一个覆盖整个单开放读码框的外显子,而编码Xenosin的基因包括至少一个内含子(见图12)。
实施例8-丝蛋白在转基因植物中的表达
编码本发明丝蛋白的植物表达载体可由置于包括卡那霉素抗性基因(Npt II)的双元载体骨架中CaMV 35S启动子下游的编码所述蛋白的重组核酸分子(例如SEQ ID NO′s:11到21、31到39、48到55、64到71、74或75所提供的任何一条多核苷酸)组成。
对于包括SEQ ID NO′s 11、13、15、17、19、31、33、35、37、48、50、52、54、64、66、68、70或74中任一条的多核苷酸,构建物可进一步包括信号肽编码区,如拟南芥液泡碱性几丁质酶信号肽,其置于编码该丝蛋白序列的框架内或上游。
在转化到拟南芥中前通过电穿孔将载有编码多肽丝蛋白的构建物分别转化根癌农杆菌。下胚轴转化法可用于转化拟南芥,其可在包括卡那霉素培养基的选择培养基上选择存活植株。重生体中根形成后,转移到土壤中建立一代转基因植物。
转化过程的验证可通过PCR筛选完成。多核苷酸的掺入和表达通过PCR、Southern印迹分析和/或胰蛋白酶切表达蛋白的LC/MS测定。
同一载体可提供两种或两种以上不同丝蛋白编码构建物,或每个编码一种不同蛋白的许多不同载体可转化到植物中。
作为植物表达的实验实施例,启动子优化版的AmelF4(Xenospira4)(SEQ IDNO:76)克隆到pET14b(Novagen)产生pET14b-6×His:F4op,形成蛋白N端带有6×组氨酸的框内翻译融合蛋白。编码蛋白“6×组氨酸:F4op”的序列克隆到pVEC8(Wang等人,1992),置于CaMV 35S启动子和ocs多腺苷酸化调节元件的控制之下,产生pVEC8-35S-6×His:F4op-ocs。pET14b-6×His:F4op转化到化学感受态E.coli中,且pVEC8-35S-6×His:F4op通过农杆菌介导转化到烟草叶片中。从抗生素抗性E.coli(诱导表达)和烟草叶中获得的蛋白分离并使用四组氨酸抗体(Qiagen,Karlsrule,Germany)进行western印迹分析检测。空载体pET14b和pVEC8-35S-ocs用于相应的宿主背景中作为负对照。如图13所示,这些实验获得了能产生Xenospira4(AmelF4)蛋白的植物。
实施例9-丝蛋白的发酵和纯化
蜜蜂基因AmelF1-F4(分别为Xenospira1到4)和草蜻蛉MalF1基因通过PCR扩增并克隆到pET14b表达载体(Novagen,Madison,WI)后构建表达构建物。产生的表达质粒电穿孔到E.coli BL21(DE3)Rosetta细胞中并在含有氨苄青霉素的LB琼脂培养基中生长过夜。单集落接种到包括氨苄青霉素的LB肉汤培养基然后在37℃生长过夜。通过离心收集细胞并用洗涤剂(Bugbuster,Novagen)溶解。包涵体广泛洗涤并重溶入6M胍盐中。
该过程产生95%以上纯度的蜜蜂蛋白混合物和50%以上纯度的草蜻蛉MalF1蛋白混合物。通常可获得达到50%产量的湿重大肠杆菌细胞片状沉淀,表明通过这种方法可容易的表达该蛋白。
溶解的蜜蜂重组蛋白加到按制造商说明制备的Talon树脂柱上。然后通过100mM Tris.HCL,150mM pH 8咪唑洗脱。
实施例10-丝蛋白加工成线
蜜蜂和草蜻蛉丝蛋白通过多种方法(见图14)使用下述步骤很容易制作成线。
晚末龄意大利蜂唾液腺前段在磷酸缓冲盐溶液中分离并移到一滴缓冲液中的平面内。用镊子夹住该段的两端。一端以恒定的速率抬离缓冲液并和另一端分离。这样可以拉出很好的迅速在空气中固化的线。
蜜蜂和草蜻蛉幼虫重组丝蛋白脱水或浓缩后形成线或片层。例如,通过将可溶蛋白滴入丁醇溶液中或通过在Talon树脂柱上浓缩。
线的获得也可通过蜜蜂或草蜻蛉重组丝蛋白和有机溶剂(如己烷)混合以在界面上以正确的构象浓缩,然后加入试剂从界面上排除(如丁醇)。通过这一过程形成的线与土丝具有相似的FT-IR光谱,表明它们包括相同的卷曲螺旋结构。
此处描述的其他物种的丝蛋白也可通过这一程序加工。
本领域技术人员应理解本发明可进行许多改变和/或修饰,如具体实施方式中所示的,而并不脱离本发明的精神或范围,如此处广泛描述的。因此,本实施方式应全面理解,作为说明而不是限制。
所有上述讨论的出版物都完整的并入此处。
本说明书包括的任何所讨论的文件、文字记录、材料、装置、物品之类的目的仅是提供本发明的上下文环境。并不因为其存在于本申请每项权利要求的优先权日之前而被当作承认这些事项的任何一项构成现有技术基础的部分或本发明相关领域的公知常识。
参考文献
Atkins E.D.T.(1967)J Mol Biol 24:139-141.
Bendtsen J.D.,Nielsen H.,von Heijne G.and Brunak S.(2004)J.Mol.Biol.340:783-795.
Bini E.,Knight D.P.and Kaplan D.L.(2004)J.Mol.Biol.335:27-40.
Craig C.L.and Riekel C.(2002)Comparative Biochemistry and Physiology Part B133:493-507.
Delorenzi M.and Speed T.(2002)Bioinformatics 18:617-625.
Deng Y.,Liu J.,Zheng Q.,Eliezer D.,Kallenbach N.R.and Lu M.(2006)Structure14:247-255.
Flower N.E.and Kenchington W.R.(1967)Journal of the Royal Microscopical Society86:297.
Grimaldi D.and Engel M.S.(2005)Evolution of insects.Cambridge University Press,New York.
Harayama S.(1998)Trends Biotech.,16;76-82.
Heimburg T,Schunemann J.,Weber K.,and Geisler N.(1999)Biochemistry 38:12727-12734.
Hepburn H.R.,Chandler H.D.and Davidoff M.R.(1979)Insect Biochem.9:66.
Kneller D.G.,Cohen F.E.and Langridge R.(1990)J.Mol.Biol.214:171-182.
LaMunyon C.W.(1988)Psyche 95:203-209.
LaMunyon C.W.and Adams P.A.(1987)Annals of the Entomological Society ofAmerica 80:804-808.
Lucas F.Shaw J.T.B.and Smith S.G.(1960)J.Mol.Biol.2:339-349.
Lucas F.and Rudall K.M.(1967)In Comprehensive Biochemistry(Ed.Florkin M andStotz H)Vol 26B pp 475-559Elsevier Amsterdam.
Lupas A.,Van Dyke M.and Stock J.(1991)Science 252:1162-1164.
McClelland J.L.and Rumelhart D.E.(1988)Explorations in Parallel DistributedProcessing vol 13.pp 318-362.MITPress,Cambridge MA.
Needleman,S.B.and Wunsch,C.D.(1970)J.Mol.Biol.,48;443-453.
Quicke D.L.J.,Shaw M.R.,Takahashi M.and Yanechin B.(2004)Journal of NaturalHistory 38:2167-2181.
Reiser K.,McCormick,Rucker R.B.(1992)The FASEB Journal 6:2439-2449.
Rost B.and Sander C.(1993)J.Molecular Biology 232:584-599.
Rost B.,Yachdav G.and Liu J.(2004)Nucleic Acids Research 32(Web Serverissue):W321-W326.
Rudall K.M.(1962)In Comparative Biochemistry(Ed.By Florkin M and Mason HS)Vol 4,pp.297-435.Academic Press,New York.
Rudall K.M.and Kenchington W.(1971)Annual Reviews in Entomology 16:73-96.
Silva-Zacarin E.C.M.,Silva De Moraes R.L.M.and Taboga S.R.(2003)J.Biosci.6:753-764.
Speilger P.E.(1962)Annals of the Entomological Society of America.55:69-77.
Wang M.B.,Li Z.Y.et al.(1998).Acta Hort.461:401-407.
Yamada H.,Shigesada K.,Igarashi Y.,Takasu Y.,Tsubouchi K.and Kato Y.(2004)Int.J.Wild Silkmoth and Silk 9:61-66.
序列表
<110>联邦科学工业研究组织
<120>丝蛋白
<130>504791
<150>US 60/723,766
<151>2005-10-05
<160>77
<170>PatentIn version 3.3
<210>1
<211>314
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>1
Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val Lys Gly Ser
1               5                   10                  15
Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg
            20                  25                  30
Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val Leu Gln Ala
        35                  40                  45
Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala Ala Asp Leu
    50                  55                  60
Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser Gln Ala Ala
65                  70                  75                  80
Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln Ala Arg Ala
                85                  90                  95
Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser Ala Ala Lys
            100                 105                 110
Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu Ser Thr Ala
        115                 120                 125
Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala Glu Ala Val
    130                 135                 140
Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala Asn Leu Ala
145                 150                 155                 160
Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala Glu Lys Val
                165                 170                 175
Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala Ala Ala Arg
            180                 185                 190
Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala Thr Ala Ser
        195                 200                 205
Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val Ala Val Leu
    210                 215                 220
Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala Ala Ser Ser
225                 230                 235                 240
Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn Val Glu Thr
                245                 250                 255
Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val Val Ser Ile
            260                 265                 270
Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser Thr Ser Trp
        275                 280                 285
Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His Ile Asn Leu
    290                 295                 300
Asn Asp Phe Asp Leu Lys Ser Asn Val Phe
305                 310
<210>2
<211>333
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>2
Met Lys Ile Pro Val Leu Leu Ala Thr Cys Leu Tyr Leu Cys Gly Phe
1               5                   10                  15
Ala Ser Ala Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val
            20                  25                  30
Lys Gly Ser Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser
        35                  40                  45
Gly Leu Arg Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val
    50                  55                  60
Leu Gln Ala Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala
65                  70                  75                  80
Ala Asp Leu Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser
                85                  90                  95
Gln Ala Ala Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln
            100                 105                 110
Ala Arg Ala Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser
       115                  120                 125
Ala Ala Lys Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu
    130                 135                 140
Ser Thr Ala Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala
145                 150                 155                 160
Glu Ala Val Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala
                165                 170                 175
Asn Leu Ala Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala
            180                 185                 190
Glu Lys Val Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala
        195                 200                 205
Ala Ala Arg Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala
    210                 215                 220
Thr Ala Ser Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val
225                 230                 235                 240
Ala Val Leu Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala
                245                 250                 255
Ala Ser Ser Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn
            260                 265                 270
Val Glu Thr Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val
        275                 280                 285
Val Ser Ile Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser
    290                 295                 300
Thr Ser Trp Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His
305                 310                 315                 320
Ile Asn Leu Asn Asp Phe Asp Leu Lys Ser Asn Val Phe
                325                 330
<210>3
<211>290
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>3
Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp Ile Gln Gly
1               5                    10                 15
Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala Leu Gly Ser
            20                  25                  30
Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu Asn Val Gly
        35                  40                  45
Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser Val Ala Ala
    50                  55                  60
Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly Ala Asn Ala
65                  70                  75                  80
Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser
                85                  90                  95
Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu Ala
            100                 105                 110
Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala Lys
        115                 120                 125
Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu Ala
   130                 135                 140
Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Ala Ala Ile
145                 150                 155                 160
Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile Ala
                165                 170                 175
Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala Ala
            180                 185                 190
Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val Val Ala Leu
        195                 200                 205
Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala Asn
    210                 215                 220
Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser Gln Ala Ala
225                 230                 235                 240
Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr
                245                 250                 255
Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn Lys Ala Ala
            260                 265                 270
Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His Val Ala Lys
        275                 280                 285
Leu Glu
    290
<210>4
<211>309
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>4
Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Val Trp Gly Leu
1               5                   10                  15
Ala Glu Gly Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp
            20                  25                  30
Ile Gln Gly Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala
        35                  40                  45
Leu Gly Ser Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu
    50                  55                  60
Asn Val Gly Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser
65                  70                  75                  80
Val Ala Ala Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly
                85                  90                  95
Ala Asn Ala Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile
            100                 105                 110
Lys Ala Ser Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala
        115                 120                 125
Ala Glu Ala Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala
    130                 135                 140
Ala Ala Lys Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala
145                 150                 155                 160
Thr Glu Ala Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg
                165                 170                 175
Ala Ala Ile Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala
            180                 185                 190
Ala Ile Ala Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile
        195                 200                 205
Ala Ala Ala Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val
    210                 215                 220
Val Ala Leu Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala
225                 230                 235                 240
Gln Ala Asn Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser
                245                 250                 255
Gln Ala Ala Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu
            260                 265                 270
Leu Val Thr Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn
        275                 280                 285
Lys Ala Ala Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His
    290                 295                 300
Val Ala Lys Leu Glu
305
<210>5
<211>316
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>5
Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val Ile Ser Lys
1               5                   10                  15
Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser Ala Lys Arg
            20                  25                  30
Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu Gln Ser Leu
        35                  40                  45
Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala Ala Ala Val
    50                  55                  60
Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu Arg Ala Ser
65                  70                  75                  80
Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Leu Lys Asn
                85                  90                  95
Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu Ala Ala Leu
            100                 105                 110
Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala Asn Ala Ala
        115                 120                 125
Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg
    130                 135                 140
Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln Lys Arg Thr
145                 150                 155                 160
Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg Gln Leu Gln
                65                 170                 175
Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu Glu Val Ser
            180                 185                 190
Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser Ser Glu Ala
        195                 200                 205
Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser Asp Ala Asp
    210                 215                 220
Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala Ala Lys Ile
225                 230                 235                 240
Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala Ser Glu Asp
                245                 250                 255
Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg Ala Asn Val
            260                 265                 270
Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly Glu Glu Ala
        275                 280                 285
Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu Ala Glu Val
    290                 295                 300
Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe
305                 310                 315
<210>6
<211>335
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>6
Met Gln Ile Pro Thr Phe Val Ala Ile Cys Leu Leu Thr Ser Gly Leu
1               5                   10                  15
Val His Ala Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val
            20                  25                  30
Ile Ser Lys Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser
        35                  40                  45
Ala Lys Arg Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu
    50                  55                  60
Gln Ser Leu Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala
65                  70                  75                  80
Ala Ala Val Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu
                85                  90                  95
Arg Ala Ser Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala
            100                 105                 110
Leu Lys Asn Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu
        115                 120                 125
Ala Ala Leu Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala
    130                 135                 140
Asn Ala Ala Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala
145                 150                 155                 160
Ser Ser Arg Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln
                165                 170                 175
Lys Arg Thr Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg
            180                 185                 190
Gln Leu Gln Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu
        195                 200                 205
Glu Val Ser Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser
    210                 215                 220
Ser Glu Ala Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser
225                 230                 235                 240
Asp Ala Asp Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala
                245                 250                 255
Ala Lys Ile Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala
            260                 265                 270
Ser Glu Asp Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg
        275                 280                 285
Ala Asn Val Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly
    290                 295                 300
Glu Glu Ala Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu
305                 310                 315                 320
Ala Glu Val Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe
                325                 330                 335
<210>7
<211>323
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>7
Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr Val
1               5                   10                  15
Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu Leu
            20                  25                  30
Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly Ala
        35                  40                  45
Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu Gly
    50                  55                  60
Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln Ser
65                  70                  75                  80
Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn Lys
                85                  90                  95
Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala Thr
            100                 105                 110
Ala Ala Ser Ser Ser Ala Leu L s Ala Ser Leu Ala Thr Glu Glu Ala
        115                 120                 125
Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala Glu
    130                 135                 140
Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg Ala
145                 150                 155                 160
Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser Ala
                165                 170                 175
Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala Ala
            180                 185                 190
Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala Asp
        195                 200                 205
Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala Asp
    210                 215                 220
Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala Glu
225                 230                 235                 240
Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln Ala
                245                 250                 255
Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala Ala
            260                 265                 270
Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu Mer
        275                 280                 285
Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu Glu
    290                 295                 300
Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp
305                 310                 315                 320
Glu Val Lys
<210>8
<211>342
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>8
Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Ile Trp Gly Leu
1               5                   10                  15
Ala Ser Gly Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr
            20                  25                  30
Ser Thr Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys
        35                  40                  45
Asp Glu Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly
    50                  55                  60
Thr Gly Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile
65                  70                  75                  80
Ser Leu Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala
                85                  90                  95
Ser Gln Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu
            100                 105                 110
Thr Asn Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala
        115                 120                 125
Arg Ala Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr
    130                 135                 140
Glu Glu Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala
145                 150                 155                 160
Ala Ala Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser
                165                 170                 175
Ala Arg Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala
            180                 185                 190
Glu Ser Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala
        195                 200                 205
Lys Ala Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala
    210                 215                 220
Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala
225                 230                 235                 240
Val Ala Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala
                245                 250                 255
Lys Ala Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val
            260                 265                 270
Leu Gln Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala
        275                 280                 285
Ala Ala Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala
    290                 295                 300
Gly Glu Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys
305                 310                 315                 320
Lys Glu Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn
                325                 330                 335
Glu Glu Trp Glu Val Lys
             340
<210>9
<211>353
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>9
Gly Val Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys Glu Glu Ser
1               5                   10                  15
Tyr Glu Lys Ser Glu Ser Lys Ser Leu Lys Glu Ile Lys Glu Glu Arg
            20                  25                  30
Ala Ser Lys Ser Lys Ser Glu Arg Leu Lys Ile Arg Glu Glu Lys Arg
        35                  40                  45
Glu Glu Glu Glu Lys Ser Lys Ser Leu Asn Leu Val Val Val Arg Glu
    50                  55                  60
Lys Ile Thr Lys Leu Ser Ser Trp Leu Lys Glu Glu Lys Asp Ile Ser
65                  70                  75                  80
Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly Leu Glu Asp
                85                  90                  95
Val Thr Asp Glu Leu Asn Ile Ala Leu Lys Ser Leu Lys Glu Gly Lys
            100                 105                 110
Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly Ser Glu Asp Val Arg Ser
        115                 120                 125
Leu Glu Glu Leu Asp Thr Ser Val Val Glu Leu Leu Lys Leu Ile Lys
    130                 135                 140
Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys Asn Gly Lys
145                 150                 155                 160
Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Ile Leu Glu Thr Cys
                165                 170                 175
Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys Asp Lys Lys
            180                 185                 190
Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp Leu Asp Trp
       195                 200                 205
Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu Leu Gly Gly
    210                 215                 220
Leu Ser Gly Leu Leu Asn Ser Leu Lys Ser Glu Lys Gly Leu Leu Gly
225                 230                 235                 240
Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu Ile Ser Glu
                245                 250                 255
Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser Val Asp Ser
            260                 265                 270
Val Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser Ser Val Ser Lys
        275                 280                 285
Val Thr Glu Leu Leu Asn Lys Gly Ile Asp Ile Gln Thr Ile Leu Asn
    290                 295                 300
Ala Lys Asn Gly Asp Glu Phe Asp Leu Ser Gly Lys Glu Leu Lys Asn
305                 310                 315                 320
Val Lys Gly Ile Phe Gly Leu Ile Gly Ser Leu Lys Arg Ser Leu Gly
                325                 330                 335
Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro Leu Leu Lys
            340                 345                 350
Leu
<210>10
<211>372
<212>PRT
<213>意大利蜂(Apis mellifera)
<400>10
Met Lys Tyr Met Leu Leu Leu Leu Ser Ile Phe Ile Cys Ala His Ile
1               5                   10                  15
Val Cys Ala Gly Val Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys
            20                  25                  30
Glu Glu Ser Tyr Glu Lys Ser Glu Ser Lys Ser Leu Lys Glu Ile Lys
        35                  40                  45
Glu Glu Arg Ala Ser Lys Ser Lys Ser Glu Arg Leu Lys Ile Arg Glu
    50                  55                  60
Glu Lys Arg Glu Glu Glu Glu Lys Ser Lys Ser Leu Asn Leu Val Val
65                  70                  75                  80
Val Arg Glu Lys Ile Thr Lys Leu Ser Ser Trp Leu Lys Glu Glu Lys
                85                  90                  95
Asp Ile Ser Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly
            100                 105                 110
Leu Glu Asp Val Thr Asp Glu Leu Asn Ile Ala Leu Lys Ser Leu Lys
        115                 120                 125
Glu Gly Lys Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly Ser Glu Asp
    130                 135                 140
Val Arg Ser Leu Glu Glu Leu Asp Thr Ser Val Val Glu Leu Leu Lys
145                 150                 155                 160
Leu Ile Lys Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys
                165                 170                 175
Asn Gly Lys Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Ile Leu
            180                 185                 190
Glu Thr Cys Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys
        195                 200                 205
Asp Lys Lys Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp
    210                 215                 220
Leu Asp Trp Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu
225                 230                 235                 240
Leu Gly Gly Leu Ser Gly Leu Leu Asn Ser Leu Lys Ser Glu Lys Gly
                245                 250                 255
Leu Leu Gly Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu
            260                 265                 270
Ile Ser Glu Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser
        275                 280                 285
Val Asp Ser Val Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser Ser
    290                 295                 300
Val Ser Lys Val Thr Glu Leu Leu Asn Lys Gly Ile Asp Ile Gln Thr
305                 310                 315                 320
Ile Leu Asn Ala Lys Asn Gly Asp Glu Phe Asp Leu Ser Gly Lys Glu
                325                 330                 335
Leu Lys Asn Val Lys Gly Ile Phe Gly Leu Ile Gly Ser Leu Lys Arg
            340                 345                 350
Ser Leu Gly Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro
        355                 360                 365
Leu Leu Lys Leu
    370
<210>11
<211>942
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>11
ggtttggagg ggccgggcaa ctcgttgccc gagctcgtga aaggtagcgc atcggccacc     60
gcgtcgaccg ctgtgaccgc tagatcagga cttagagccg gacaagtagc tttagcttcg    120
cagaaggatg ccgtactcca agctcaagct gctgcatccg ccgcgtcaga ggcgcgcgct    180
gctgccgatc tgacggctaa acttagccaa gaatcggcat cagtgcaatc gcaggctgcc    240
gccaaaggga aggaaacgga ggaggcagct gttggtcaag ctagggctgg cctcgagtcg    300
gtgtccatgg ccgcatcagc cacatctgct gccaaagaag catcgaccgc cgccaaagcc    360
gcagcatccg cactatccac agccgtggtg caagcgaaaa tagctgagag ggcagccaaa    420
gctgaagctg ttgcctcgga cgaagccaag gccaaggcga ttgcagcagc caacttggcg    480
gctgaggcca gtgtagccgc agaagcagct ctcaaggccg agaaagtggc cgaagaagcc    540
atcgcaagag cggcctctgc aaaggctgcc gcaagagctg ctgctgccgc tctagcctcc    600
tcgaaggaag cagccacggc cagcgcaaga aacgccgcgg aatccgaggc caggaacgaa    660
gtagctgtat tgatcgccga gattgataaa aagagtaggg aaatcgacgc agccagttcg    720
cttaatgcgc gtgccgctgc caaggcaagc tccaggaacg tagaaacggc gacaatcggg    780
gccaacatca actcttcgaa acaagtcgtg tcaattccag tggaaataaa gaaattctcg    840
gagccggaag tgtcaacatc atggagagaa gatgaagagg ttacgaaaga gaagaaggag    900
cacataaatc tgaacgactt cgacttgaag agcaacgtat tt                       942
<210>12
<211>999
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>12
atgaagattc cagtattgct tgcaacgtgc ctctaccttt gcggatttgc gtccgccggt     60
ttggaggggc cgggcaactc gttgcccgag ctcgtgaaag gtagcgcatc ggccaccgcg    120
tcgaccgctg tgaccgctag atcaggactt agagccggac aagtagcttt agcttcgcag    180
aaggatgccg tactccaagc tcaagctgct gcatccgccg cgtcagaggc gcgcgctgct    240
gccgatctga cggctaaact tagccaagaa tcggcatcag tgcaatcgca ggctgccgcc    300
aaagggaagg aaacggagga ggcagctgtt ggtcaagcta gggctggcct cgagtcggtg    360
tccatggccg catcagccac atctgctgcc aaagaagcat cgaccgccgc caaagccgca    420
gcatccgcac tatccacagc cgtggtgcaa gcgaaaatag ctgagagggc agccaaagct    480
gaagctgttg cctcggacga agccaaggcc aaggcgattg cagcagccaa cttggcggct    540
gaggccagtg tagccgcaga agcagctctc aaggccgaga aagtggccga agaagccatc    600
gcaagagcgg cctctgcaaa ggctgccgca agagctgctg ctgccgctct agcctcctcg    660
aaggaagcag ccacggccag cgcaagaaac gccgcggaat ccgaggccag gaacgaagta    720
gctgtattga tcgccgagat tgataaaaag agtagggaaa tcgacgcagc cagttcgctt    780
aatgcgcgtg ccgctgccaa ggcaagctcc aggaacgtag aaacggcgac aatcggggcc    840
aacatcaact cttcgaaaca agtcgtgtca attccagtgg aaataaagaa attctcggag    900
ccggaagtgt caacatcatg gagagaagat gaagaggtta cgaaagagaa gaaggagcac    960
ataaatctga acgacttcga cttgaagagc aacgtattt                           999
<210>13
<211>870
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>13
cgcgtgatta atcacgagtc cctgaagacg agcgaggata ttcaaggagg atattcagca     60
ggaatagtcg gtgatggatc tgacgcgctt ggctcctcca tagaaaacgc ccaaaaagtc    120
gctcgagcgg ctgaaaacgt gggcttgaat ctggaattgg gcgcaggcgc gcgtgctgcc    180
agtgttgccg ctgctgccca ggccaaaaac acagaggctg cggaagcagg agcaaacgcc    240
gctctggccg ccgccattgc caaacgggag gaagcgatta aagccagcga gatagcaaac    300
caattgttga ccaatgcagc aaaagcggca gaagcgactg tatcggcaac gaagagggca    360
gcacaattga cggctgcagc gaaagaagca accagagctt ctgcagccgc tgctgaagct    420
gctacggagg cccaggtaaa ggctaacgcc gattcaatca tcacgaagag ggctgcgatt    480
gccgaggctc aagctgcggc ggaagctcaa gttaaggcgg caatcgccag aaaatcggca    540
gcgaattttt tggctaaggc tcaaatagcg gctgccgcgg aatccgaggc cacgaaactc    600
gcggccgaag ctgtagtggc actaacaaac gccgaagtcg ccgtgaacca ggctagaaac    660
gcacaggcaa acgcctcgac tcaagcttcc atggctgtta gggtagattc tcaagcagcg    720
aacgctgaag cagccgctgt agcgcaagcc gaaactctct tggttacggc agaagctgtc    780
gcagctgcgg aggctgaggt tgcgaacaaa gccgccacat ttgcaaaaca gatcgtcaac    840
gagaagaaaa tacatgtagc aaagttggaa                                     870
<210>14
<211>927
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>14
atgaagattc cagcaatatt cgtcacgtct ctgctggtct ggggattggc cgagggccgc     60
gtgattaatc acgagtccct gaagacgagc gaggatattc aaggaggata ttcagcagga    120
atagtcggtg atggatctga cgcgcttggc tcctccatag aaaacgccca aaaagtcgct    180
cgagcggctg aaaacgtggg cttgaatctg gaattgggcg caggcgcgcg tgctgccagt    240
gttgccgctg ctgcccaggc caaaaacaca gaggctgcgg aagcaggagc aaacgccgct    300
ctggccgccg ccattgccaa acgggaggaa gcgattaaag ccagcgagat agcaaaccaa    360
ttgttgacca atgcagcaaa agcggcagaa gcgactgtat cggcaacgaa gagggcagca    420
caattgacgg ctgcagcgaa agaagcaacc agagcttctg cagccgctgc tgaagctgct    480
acggaggccc aggtaaaggc taacgccgat tcaatcatca cgaagagggc tgcgattgcc    540
gaggctcaag ctgcggcgga agctcaagtt aaggcggcaa tcgccagaaa atcggcagcg    600
aattttttgg ctaaggctca aatagcggct gccgcggaat ccgaggccac gaaactcgcg    660
gccgaagctg tagtggcact aacaaacgcc gaagtcgccg tgaaccaggc tagaaacgca    720
caggcaaacg cctcgactca agcttccatg gctgttaggg tagattctca agcagcgaac    780
gctgaagcag ccgctgtagc gcaagccgaa actctcttgg ttacggcaga agctgtcgca    840
gctgcggagg ctgaggttgc gaacaaagcc gccacatttg caaaacagat cgtcaacgag    900
aagaaaatac atgtagcaaa gttggaa                                        927
<210>15
<211>949
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>15
ggcgtcgagg aattcaagtc ctcggcaacc gaggaggtga tcagcaaaaa cttagaagtc     60
gacctgttga aaaatgtgga cactagcgcg aaacgaagag agaacggcgc cccggtgctc    120
ggcaagaaca cacttcaatc cctggagaag atcaagacgt cggcgagcgt gaatgccaaa    180
gcagcagccg tggtgaaagc gtccgctctg gctcttgcag aggcctattt gcgagcgtcc    240
gcattgtcag ccgccgcttc agccaaggca gccgccgccc tgaaaaatgc tcaacaagcg    300
caattaaacg cccaggaaaa gtctttggcc gcgttgaaag ctcagtccga ggaagaggca    360
gcttctgctc gtgcaaacgc agcaaccgcc gcgacacagt cggcactgga acgcgctcaa    420
gcctcctcca ggttagcaac ggtcgcccaa aacgtagcca gcgacttgca gaaacggacc    480
agcaccaagg ccgcggctga agccgctgcc accctcagac aattacagga cgcggaacga    540
acgaaatgga gtgccaacgc tgccttagaa gtctccgccg ctgcagctgc cgcagaaacc    600
aagaccactg cctcctcgga ggccgccaac gccgccgcca aaaaggcggc cgcgatagct    660
tctgacgcgg acggcgcgga aaggtcggca tctaccgagg cacaatcagc tgcgaagatc    720
gagagtgtgg cagccgccga gggatccgcc aactcggcct ctgaggattc ccgggccgct    780
caattggaag cctccaccgc ggcgagagcc aacgtggccg cagctgtcgg ggatggagcg    840
attataggac ttggagagga agcgggtgcc gcggctcagt tgcttgcaca ggcgaaggca    900
ttggccgaag ttagctcgaa atccgaaaat attgaggata aaaaatttt                949
<210>16
<211>1006
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>16
atgcagatcc caacgtttgt cgccatatgc ttgctcacat cgggcttggt gcacgcaggc     60
gtcgaggaat tcaagtcctc ggcaaccgag gaggtgatca gcaaaaactt agaagtcgac    120
ctgttgaaaa atgtggacac tagcgcgaaa cgaagagaga acggcgcccc ggtgctcggc    180
aagaacacac ttcaatccct ggagaagatc aagacgtcgg cgagcgtgaa tgccaaagca    240
gcagccgtgg tgaaagcgtc cgctctggct cttgcagagg cctatttgcg agcgtccgca    300
ttgtcagccg ccgcttcagc caaggcagcc gccgccctga aaaatgctca acaagcgcaa    360
ttaaacgccc aggaaaagtc tttggccgcg ttgaaagctc agtccgagga agaggcagct    420
tctgctcgtg caaacgcagc aaccgccgcg acacagtcgg cactggaacg cgctcaagcc    480
tcctccaggt tagcaacggt cgcccaaaac gtagccagcg acttgcagaa acggaccagc    540
accaaggccg cggctgaagc cgctgccacc ctcagacaat tacaggacgc ggaacgaacg    600
aaatggagtg ccaacgctgc cttagaagtc tccgccgctg cagctgccgc agaaaccaag    660
accactgcct cctcggaggc cgccaacgcc gccgccaaaa aggcggccgc gatagcttct    720
gacgcggacg gcgcggaaag gtcggcatct accgaggcac aatcagctgc gaagatcgag    780
agtgtggcag ccgccgaggg atccgccaac tcggcctctg aggattcccg ggccgctcaa    840
ttggaagcct ccaccgcggc gagagccaac gtggccgcag ctgtcgggga tggagcgatt    900
ataggacttg gagaggaagc gggtgccgcg gctcagttgc ttgcacaggc gaaggcattg    960
gccgaagtta gctcgaaatc cgaaaatatt gaggataaaa aatttt                  1006
<210>17
<211>969
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>17
gcaagggaag aggtggagac acgggacaag accaagacct cgacagtggt gaaaagcgag    60
aaagtggaag tcgttgctcc cgctaaggat gaacttaaat taacgagcga gcctatcttt    120
ggaagaagag tgggaactgg agcatccgag gtggcatcta gcagcggtga agccatcgcg    180
ataagtcttg gagcagggca gtcagcggca gagtctcagg ccttggccgc ctcgcaatcc    240
aaaacggcag cgaacgccgc cataggcgcg agcgagctta ccaacaaagt tgctgctcta    300
gttgctggcg cgactggtgc gcaggcgaga gctacggccg cctcctcgag cgcgttgaag    360
gccagcttgg cgaccgaaga agcggcggaa gaggccgagg cggccgtggc tgacgccaag    420
gctgccgcgg aaaaggccga atccctggcg aaaaatctcg cgtcggcgag cgctcgcgcg    480
gccctctcct ccgaaagggc gaacgaattg gctcaagctg agagcgctgc agcggccgag    540
gcgcaggcca agacagcagc cgccgccaaa gcagcggaaa tcgcccttaa ggtcgctgag    600
atagcggtga aggcggaagc ggacgcagca gctgccgccg tggcagctgc aaaggcaaga    660
gccgtggcag acgcggccgc tgcccgtgcc gcagccgtga acgccatcgc caaggcggaa    720
gaggaggcct cggcccaagc agagaacgcc gccggtgttt tgcaagcagc cgcctccgcc    780
gcggcggaat cgcgagccgc tgcagctgcc gccgctgcta cctcggaggc agcggctgaa    840
gctggcccgt tggcaggtga gatgaaacca ccgcactgga aatgggaacg gattcctgtg    900
aagaaggagg agtggaaaac gtcaacgaag gaagaatgga aaacgacgaa tgaagaatgg    960
gaggtgaag                                                            969
<210>18
<211>1026
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>18
atgaagatcc catccatact cgcggtttcc ctgctgatct ggggtttggc aagcggcgca     60
agggaagagg tggagacacg ggacaagacc aagacctcga cagtggtgaa aagcgagaaa    120
gtggaagtcg ttgctcccgc taaggatgaa cttaaattaa cgagcgagcc tatctttgga    180
agaagagtgg gaactggagc atccgaggtg gcatctagca gcggtgaagc catcgcgata    240
agtcttggag cagggcagtc agcggcagag tctcaggcct tggccgcctc gcaatccaaa    300
acggcagcga acgccgccat aggcgcgagc gagcttacca acaaagttgc tgctctagtt    360
gctggcgcga ctggtgcgca ggcgagagct acggccgcct cctcgagcgc gttgaaggcc    420
agcttggcga ccgaagaagc ggcggaagag gccgaggcgg ccgtggctga cgccaaggct    480
gccgcggaaa aggccgaatc cctggcgaaa aatctcgcgt cggcgagcgc tcgcgcggcc    540
ctctcctccg aaagggcgaa cgaattggct caagctgaga gcgctgcagc ggccgaggcg    600
caggccaaga cagcagccgc cgccaaagca gcggaaatcg cccttaaggt cgctgagata    660
gcggtgaagg cggaagcgga cgcagcagct gccgccgtgg cagctgcaaa ggcaagagcc    720
gtggcagacg cggccgctgc ccgtgccgca gccgtgaacg ccatcgccaa ggcggaagag    780
gaggcctcgg cccaagcaga gaacgccgcc ggtgttttgc aagcagccgc ctccgccgcg    840
gcggaatcgc gagccgctgc agctgccgcc gctgctacct cggaggcagc ggctgaagct    900
ggcccgttgg caggtgagat gaaaccaccg cactggaaat gggaacggat tcctgtgaag    960
aaggaggagt ggaaaacgtc aacgaaggaa gaatggaaaa cgacgaatga agaatgggag   1020
gtgaag                                                              1026
<210>19
<211>1059
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>19
ggcgtaaata cagaattaaa aaaagatggt gaactaaagg aagagtctta tgagaaaagc     60
gagtcaaaga gtttaaaaga aattaaagaa gaacgtgctt caaaatcaaa aagtgaacgt    120
ttgaagattc gtgaagaaaa acgcgaagag gaagaaaaat ccaagagtct gaatctggtc    180
gtggtcagag aaaagattac caaactttct tcatggctca aagaagagaa agatatcagt    240
cctcttttgg aagaaaaaaa tggcaaaggt ctattgggtt tggaagatgt cacggacgag    300
ttaaatatcg ctcttaaatc gttgaaggag ggcaaaaagt ttgatacttg gaaattcgag    360
aaaggtagcg aagacgttcg ttctttggaa gaacttgata cgagcgtcgt tgaactttta    420
aaattaataa aggaaggaaa aactgaccat ggtgctatag atttggagaa gaatggtaag    480
gtacttgtag atttggaaaa aatctcagaa aacatacttg aaacttgtgg atcacaaaag    540
aagactgtgg aagttgtaga tgataaagac aaaaaatgga ataaagaatc aggttggaaa    600
aaaaatctaa atgatctaga ttggaaaaaa gatttagata aagataaagt tggtggcggt    660
ttgcttggcg gtttaagtgg cctcttaaat agtttaaaat cagaaaaagg tcttctaggt    720
cttttgaata agaatcaaat tgagttatta attcctttaa tcagtgagat aaaaaagaaa    780
aatatagatt ttaatctctt cgattctgtt gattctgtcg aaagaaattt agacttgaaa    840
cttttcacaa gttctgtttc aaaagttact gaattattaa ataaaggaat cgatattcaa    900
acaattttga atgcgaaaaa tggagatgaa ttcgatttaa gcggcaaaga attgaaaaac    960
gtcaaaggga tatttggttt gattggaagt ttgaaacgct cattaggatt agaaaatata   1020
ttgaacttac cgtttaaacg tatacctctg cttaaatta                          1059
<210>20
<211>1116
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>20
atgaaataca tgctcttgtt gctatctata ttcatctgtg cacatattgt atgcgcaggc     60
gtaaatacag aattaaaaaa agatggtgaa ctaaaggaag agtcttatga gaaaagcgag    120
tcaaagagtt taaaagaaat taaagaagaa cgtgcttcaa aatcaaaaag tgaacgtttg    180
aagattcgtg aagaaaaacg cgaagaggaa gaaaaatcca agagtctgaa tctggtcgtg    240
gtcagagaaa agattaccaa actttcttca tggctcaaag aagagaaaga tatcagtcct    300
cttttggaag aaaaaaatgg caaaggtcta ttgggtttgg aagatgtcac ggacgagtta    360
aatatcgctc ttaaatcgtt gaaggagggc aaaaagtttg atacttggaa attcgagaaa    420
ggtagcgaag acgttcgttc tttggaagaa cttgatacga gcgtcgttga acttttaaaa    480
ttaataaagg aaggaaaaac tgaccatggt gctatagatt tggagaagaa tggtaaggta    540
cttgtagatt tggaaaaaat ctcagaaaac atacttgaaa cttgtggatc acaaaagaag    600
actgtggaag ttgtagatga taaagacaaa aaatggaata aagaatcagg ttggaaaaaa    660
aatctaaatg atctagattg gaaaaaagat ttagataaag ataaagttgg tggcggtttg    720
cttggcggtt taagtggcct cttaaatagt ttaaaatcag aaaaaggtct tctaggtctt    780
ttgaataaga atcaaattga gttattaatt cctttaatca gtgagataaa aaagaaaaat    840
atagatttta atctcttcga ttctgttgat tctgtcgaaa gaaatttaga cttgaaactt    900
ttcacaagtt ctgtttcaaa agttactgaa ttattaaata aaggaatcga tattcaaaca    960
attttgaatg cgaaaaatgg agatgaattc gatttaagcg gcaaagaatt gaaaaacgtc   1020
aaagggatat ttggtttgat tggaagtttg aaacgctcat taggattaga aaatatattg   1080
aacttaccgt ttaaacgtat acctctgctt aaatta                             1116
<210>21
<211>1660
<212>DNA
<213>意大利蜂(Apis mellifera)
<400>21
atgaaataca tgctcttgtt gctatctata ttcatctgtg cacatattgt atgcgcaggc     60
gtaaatacag aattaaaaaa agatggtgaa ctaaaggaag agtcttatga gaaaagcgag    120
tcaaagagtt taaaagaaat taaagaagaa cgtgcttcaa aatcaaaaag tgaacgtttg    180
aagattcgtg aaggtaattc gtgagattca agattcaaat caattaaatt tgaaaattat    240
gaaagtagta ttgttaaatt ataagataga agattttatc taaaaaataa taaattaagc    300
tttttgtatt tttggatatt gtagatattt ttaatataga attcttataa agttaaaaaa    360
tattttataa attaaacaac tttttattat ttttatgatc taaaaattaa aaatttcaag    420
ttaaagttca aattaaaaat ttgtaaaaaa tatggaaaaa acataaaaat tgaatttgtt    480
gtaatttaaa aaggattttt attatttatt gattaattat gaatataagt tcgaaaaatc    540
ctaaatatta atgtttaaaa ttttaattct taacaaaata tatttaattt aattcttaac    600
aaagatacat ttaaagaatt tcgcaaattt aaaaattagg tttttaattt taagaatcaa    660
atggtaaaaa acattttaaa tttgaaatat ataaaagtaa atcttttaat cgacaaacgg    720
atgaatttat tgattagaaa aacgcgaaga ggaagaaaaa tccaagagtc tgaatctggt    780
cgtggtcaga gaaaagatta ccaaactttc ttcatggctc aaagaagaga aagatatcag    840
tcctcttttg gaagaaaaaa atggcaaagg tctattgggt ttggaagatg tcacggacga    900
gttaaatatc gctcttaaat cgttgaagga gggcaaaaag tttgatactt ggaaattcga    960
gaaaggtagc gaagacgttc gttctttgga agaacttgat acgagcgtcg ttgaactttt   1020
aaaattaata aaggaaggaa aaactgacca tggtgctata gatttggaga agaatggtaa   1080
ggtacttgta gatttggaaa aaatctcaga aaacatactt gaaacttgtg gatcacaaaa   1140
gaagactgtg gaagttgtag atgataaaga caaaaaatgg aataaagaat caggttggaa   1200
aaaaaatcta aatgatctag attggaaaaa agatttagat aaagataaag ttggtggcgg   1260
tttgcttggc ggtttaagtg gcctcttaaa tagtttaaaa tcagaaaaag gtcttctagg   1320
tcttttgaat aagaatcaaa ttgagttatt aattccttta atcagtgaga taaaaaagaa   1380
aaatatagat tttaatctct tcgattctgt tgattctgtc gaaagaaatt tagacttgaa   1440
acttttcaca agttctgttt caaaagttac tgaattatta aataaaggaa tcgatattca   1500
aacaattttg aatgcgaaaa atggagatga attcgattta agcggcaaag aattgaaaaa   1560
cgtcaaaggg atatttggtt tgattggaag tttgaaacgc tcattaggat tagaaaatat  1620
attgaactta ccgtttaaac gtatacctct gcttaaatta                        1660
<210>22
<211>308
<212>PRT
<213>授粉熊蜂(Bombus terrestris)
<400>22
Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser Ala Ser Ala
1               5                   10                  15
Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg Ala Gly Gln
            20                  25                  30
Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala Asp Ala Ser
        35                  40                  45
Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln Ser Ala Ser
   50                  55                  60
Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala Ala Arg Ala
65                  70                  75                  80
Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala Glu Leu Gln
                85                  90                  95
Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg Glu Ala Ala
            100                 105                 110
Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala Ala Val Gln
        115                 120                 125
Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu Ala Ser Glu
    130                 135                 140
Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala
145                 150                 155                 160
Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile Ala Glu Glu
                165                 170                 175
Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg Ala Ala Ala
            180                 185                 190
Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser Ala Arg Ser
        195                 200                 205
Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu Ile Ser Glu
    210                 215                 220
Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser Ala Lys Ala
225                 230                 235                 240
Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr Ala Val Ile
                245                 250                 255
Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile Pro Ile Glu
            260                 265                 270
Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu Glu Asn Val
        275                 280                 285
Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr Ser Ser Glu
    290                 295                 300
Ala Trp Ser Ile
305
<210>23
<211>327
<212>PRT
<213>授粉熊蜂(Bombus terrestris)
<400>23
Met Lys Ile Pro Ala Leu Leu Val Thr Cys Leu Tyr Leu Trp Gly Phe
1               5                   10                  15
Ala Ser Ala Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser
            20                  25                  30
Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg
        35                  40                  45
Ala Gly Gln Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala
    50                  55                  60
Asp Ala Ser Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln
65                  70                  75                  80
Ser Ala Ser Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala
                85                  90                  95
Ala Arg Ala Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala
            100                 105                 110
Glu Leu Gln Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg
        115                 120                 125
Glu Ala Ala Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala
    130                 135                 140
Ala Val Gln Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu
145                 150                 155                 160
Ala Ser Glu Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala
                165                 170                 175
Ala Ala Ala Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile
            180                 185                 190
Ala Glu Glu Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg
        195                 200                 205
Ala Ala Ala Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser
    210                 215                 220
Ala Arg Ser Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu
225                 230                 235                 240
Ile Ser Glu Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser
                245                 250                 255
Ala Lys Ala Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr
            260                 265                 270
Ala Val Ile Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile
        275                 280                 285
Pro Ile Glu Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu
    290                 295                 300
Glu Asn Val Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr
305                 310                 315                 320
Ser Ser Glu Ala Trp Ser Ile
                325
<210>24
<211>293
<212>PRT
<213>授粉熊蜂(Bombus rerrestris)
<400>24
His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro Ala Leu Pro Glu
1               5                   10                  15
Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser Met Glu Asn Gly
            20                  25                  30
Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu Arg Thr Glu Leu
        35                  40                  45
Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr Lys Gln Ala Lys
    50                  55                  60
Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala Ile Ala Ile Ala
65                  70                  75                  80
Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu Leu Ala Ser Lys
                85                  90                  95
Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala Val Ser Ala Thr
            100                 105                 110
Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala Ala Ala Lys Ala
        115                 120                 125
Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln Val Arg Ala Asn
    130                 135                 140
Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala Glu Ala Lys Ala
145                 150                 155                 160
Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys Lys Ala Ala Ala
                165                 170                 175
Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala Glu Ser Glu Ala
            180                 185                 190
Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala Lys Ala Arg Val
        195                 200                 205
Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala Thr Ala Gln Ala
    210                 215                 220
Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn Ala Glu Ala Ser
225                 230                 235                 240
Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala Glu Ala Val Ser
                245                 250                 255
Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser Trp Gly Glu Glu
            260                 265                 270
Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp Arg Leu Asn Glu
        275                 280                 285
Arg Gln Asp Asn Trp
    290
<210>25
<211>313
<212>PRT
<213>授粉熊蜂(Bombus terrestris)
<400>25
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Val Trp Gly Gly
1               5                   10                  15
Leu Ala Glu Gly His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro
            20                  25                  30
Ala Leu Pro Glu Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser
        35                  40                  45
Met Glu Asn Gly Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu
    50                  55                  60
Arg Thr Glu Leu Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr
65                  70                  75                  80
Lys Gln Ala Lys Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala
                85                  90                  95
Ile Ala Ile Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu
             100                 105                 110
Leu Ala Ser Lys Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala
        115                 120                 125
Val Ser Ala Thr Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala
    130                 135                 140
Ala Ala Lys Ala Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln
145                 150                 155                 160
Val Arg Ala Asn Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala
                165                 170                 175
Glu Ala Lys Ala Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys
            180                 185                 190
Lys Ala Ala Ala Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala
        195                 200                 205
Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala
    210                 215                 220
Lys Ala Arg Val Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala
225                 230                 235                 240
Thr Ala Gln Ala Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn
                245                 250                 255
Ala Glu Ala Ser Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala
            260                 265                 270
Glu Ala Val Ser Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser
        275                 280                 285
Trp Gly Glu Glu Cys His Gln Arg Glu Lys ValThr Phe Ser Glu Asp
    290                 295                 300
Arg Leu Asn Glu Arg Gln Asp Asn Trp
305                 310
<210>26
<211>313
<212>PRT
<213>授粉熊蜂(Bombus terrestris)
<400>26
Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val Leu Val Glu
1               5                   10                  15
Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg Lys Glu Asn
            20                  25                  30
Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu Ala Ser Thr
        35                  40                  45
Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys Val Lys Ala
    50                  55                  60
Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser Ala Ala Phe
65                  70                  75                  80
Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu Ala Thr Gln
                85                  90                  95
Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu Lys Thr Gln
            100                 105                 110
Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala Ala Ala Ala
        115                 120                 125
Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg Ala Ala Thr
    130                 135                 140
Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val Ala Thr Ser
145                 150                 155                 160
Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln Ser Ala Ala
                165                 170                 175
Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala Ala Ala Ala
            180                 185                 190
Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser Thr Ala Ala
        195                 200                 205
Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser Ser Ala Glu
    210                 215                 220
Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile Ala Gly Thr
225                 230                 235                 240
Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn Ser Arg Thr
                245                 250                 255
Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala Ala Ala Ala
            260                 265                 270
Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala Ser Ala Ala
        275                 280                 285
Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala Ser Ala Ser
    290                 295                 300
Leu Gly Ala Ser Glu Lys Asp Lys Lys
305                 310
<210>27
<211>332
<212>PRT
<213>授粉熊蜂(Bombus terrestris)
<400>27
Met Gln Ile Pro Ala Ile Phe Val Thr Cys Leu Leu Thr Trp Gly Leu
1               5                   10                  15
Val His Ala Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val
            20                  25                  30
Leu Val Glu Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg
        35                  40                  45
Lys Glu Asn Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu
    50                  55                  60
Ala Ser Thr Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys
65                  70                  75                  80
Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser
                85                  90                  95
Ala Ala Phe Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu
            100                 105                 110
Ala Thr Gln Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu
        115                 120                 125
Lys Thr Gln Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala
    130                 135                 140
Ala Ala Ala Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg
145                 150                 155                 160
Ala Ala Thr Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val
                165                 170                 175
Ala Thr Ser Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln
            180                 185                 190
Ser Ala Ala Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala
        195                 200                 205
Ala Ala Ala Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser
    210                 215                 220
Thr Ala Ala Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser
225                 230                 235                 240
Ser Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile
                245                 250                 255
Ala Gly Thr Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn
            260                 265                 270
Ser Arg Thr Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala
        275                 280                 285
Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala
    290                 295                 300
Ser Ala Ala Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala
305                 310                 315                 320
Ser Ala Ser Leu Gly Ala Ser Glu Lys Asp Lys Lys
                325                 330
<210>28
<211>338
<212>PRT
<213>授粉熊蜂(Bombus terrestris)
<400>28
Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val Lys Thr Glu
1               5                   10                  15
Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly Ser Gln Thr
            20                  25                  30
Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu Ala Leu Ala
        35                  40                  45
Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala Ser Val Thr
    50                  55                  60
Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr Gly Lys Lys
65                  70                  75                  80
Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly Glu Ala Ile
                85                  90                  95
Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala
            100                 105                 110
Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala Asn Ala Gly
        115                 120                 125
Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala Ala Ala Ala
    130                 135                 140
Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys Ala Ser Leu
145                 150                 155                 160
Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala ValAla Leu Ala
                165                 170                 175
Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr Ala Ala Ala
            180                 185                 190
Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn Glu Leu Ala
        195                 200                 205
Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys Ala Ala Ala
    210                 215                 220
Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu Thr Ala Val
225                 230                 235                 240
Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala
                245                 250                 255
Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala Val Asn Ala
            260                 265                 270
Ile Ala Glu Ala Glu Glu Arg As  Ser Ala Gln Ala Glu Asn Thr Ala
        275                 280                 285
Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln Asp Ser Cys
    290                 295                 300
Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr Ala Trp Trp
305                 310                 315                 320
Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro Arg Asn Arg
                325                 330                 335
Arg Thr
<210>29
<211>357
<212>PRT
<213>授粉熊蜂(Bombus terrestris)
<400>29
Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Val Trp Gly Leu
1               5                   10                  15
Ala Ser Ala Gly Lys Pro Leu Ile Ala Ash Ala Gln Ile Gly Lys Val
            20                  25                  30
Lys Thr Glu Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly
        35                  40                  45
Ser Gln Thr Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu
    50                  55                  60
Ala Leu Ala Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala
65                  70                  75                  80
Ser Val Thr Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr
                85                  90                  95
Gly Lys Lys Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly
            100                 105                 110
Glu Ala Ile Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala
        115                 120                 125
Gln Ala Ala Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala
    130                 135                 140
Asn Ala Gly Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala
145                 150                 155                 160
Ala Ala Ala Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys
                165                 170                 175
Ala Ser Leu Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val
            180                 185                 190
Ala Leu Ala Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr
        195                 200                 205
Ala Ala Ala Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn
    210                 215                 220
Glu Leu Ala Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys
225                 230                 235                 240
Ala Ala Ala Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu
                245                 250                 255
Thr Ala Val Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala
            260                 265                 270
Ala Lys Ala Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala
        275                 280                 285
Val Asn Ala Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu
    290                 295                 300
Asn Thr Ala Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln
305                 310                 315                 320
Asp Ser Cys Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr
                325                 330                 335
Ala Trp Trp Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro
            340                 345                 350
Arg Asn Arg Arg Thr
        355
<210>30
<211>422
<212>PRT
<213>授粉熊蜂(Bombus terrestris)
<400>30
Gly Asn Ser Glu Ser Gly Glu Asn Trp Lys Asn Gly Glu Ser Ser Glu
1               5                   10                  15
Ser Gly Lys Asn Trp Arg Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn
            20                  25                  30
Trp Lys Asn Gly Gly Ser Ser Glu Ser Asn Lys His Trp Lys Asn Gly
        35                  40                  45
Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Ser Glu
    50                  55                  60
Ser Gly Lys Asn Trp Lys Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn
65                  70                  75                  80
Trp Lys Asn Gly Gly Ser Ser Glu Ser Asn Lys His Trp Lys Ser Gly
                85                  90                  95
Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Gly Asn
            100                 105                 110
Lys Gly Lys Ser Ser Lys Ser Ser Glu Ser Trp Lys Ser Asn Glu Asn
        115                 120                 125
Ser Lys Asn Asp Gly Ser Trp Lys Ser Ser Glu Glu Ser Glu Lys Trp
    130                 135                 140
Lys Asp Gly Lys Ala Val Ala Glu Asp Ser Val Ser Ile Asn Trp Ala
145                 150                 155                 160
Asp Val Lys Glu Gln Ile Ser Asn Ile Ala Thr Ser Leu Glu Lys Gly
               165                 170                 175
Gly Asn Leu Glu Ala Val Leu Lys Ile Lys Lys Gly Glu Lys Lys Ile
            180                 185                 190
Ser Ser Leu Glu Glu Ile Lys Glu Lys Ile Ser Val Leu Leu Lys Trp
        195                 200                 205
Ile Gln Glu Gly Lys Asp Thr Ser Ser Leu Leu Asp Leu Lys Glu Gly
    210                 215                 220
Ser Lys Asp Ile Ala Ser Leu Lys Glu Ile Lys Gly Lys Ile Leu Leu
225                 230                 235                 240
Ile Val Lys Leu Val Asn Glu Gly Lys Asp Thr Ser Gly Leu Leu Asp
                245                 250                 255
Leu Glu Ala Ser Gly Lys Val Ile Leu Glu Leu Gln Ser Ala Ile Glu
            260                 265                 270
Lys Val Leu Val Lys Ser Glu Lys Val Thr Lys Val Ser Glu Val Ser
        275                 280                 285
Gly Leu Val Lys Ser Lys Thr Val Ser Asp Ile Lys Pro Leu Gln Ala
    290                 295                 300
Val Ile Pro Leu Ile Leu Glu Leu Gln Lys Thr Asp Ile Asn Leu Ser
305                 310                 315                 320
Thr Leu Asn Lys Trp Ser Thr Val Asn Val Asn Ser Ile Asp Lys Glu
                325                 330                 335
Arg Val Thr Lys Thr Val Pro Val Leu Leu Gln Ser Met Lys Gly Gly
            340                 345                 350
Glu Asp Ile Gln Asn Leu Leu Ser Ala Lys Gly Ala Lys Lys Leu Gly
        355                 360                 365
Ile Ser Ala Leu Asp Leu Gln Ala Val Gln Gly Ala Leu Gly Val Val
    370                 375                 380
Gly Lys Leu Ser Ser Gly Gly Ala Leu Asn Ser Lys Gly Leu Leu Asn
385                 390                 395                 400
Leu Lys Asp Gly Ala Ser Val Leu Gly Ala Gly Lys Ile Gly Gly Leu
                405                 410                 415
Ile Pro Leu Pro Lys Leu
            420
<210>31
<211>927
<212>DNA
<213>授粉熊蜂(Bombus terrestris)
<400>31
ggccagagct cacctctgct cgagatcgtg cagggtagcg cgtcggccac cgcatccacc     60
gctgtgaccg ctagatccgg acttcgtgcc ggtcaggtag ccgtggcctc gcagaaggat    120
gccacacttc aggcagatgc ctcagcggcc gccgcggccg ctgcacgcgc ttccgccgac    180
cagtcggcca gtctagccca acagtcggcg tctttgcagt ccaaagctgc cgccagagca    240
aaatcagccg aggagtcagc ggcagctacg gccaaagccg agttgcaggc agaatccatt    300
gctgcatctg ccagttccaa tgccagagag gctgcagcgt ccgcaaaagc ctccgcatcc    360
gcgatgtcat cggctgccgt gcaggcgaaa ctcgctgaaa agacggccaa gaatcaagct    420
ctggcttccg aagaagccaa actcaaggct gccgccgctg ccagcgcagc agcagcagcc    480
agcgccgccg ccgaggcagc cctgaaagct gagagaatag cggaagaagc catcgccaag    540
gcggccgctg ccaaagcagc cgccagagcc gctgcagccg cgttaaactc cgcgaaggaa    600
gccgccacga gcagcgcaag gagcgccgcc gaagccgaag ctaagagcga agtcgctata    660
ctgatcagcg aactcgacaa gaagagcagg gaagtcgccg cttccgcgtc cgccaaggca    720
cgcgctgctg ctgcggctag ctccagaaac gcagaaacgg ctgttatcgg agctaacatc    780
aatgtggcca aagaggtctt ggcgattccc atcgagccaa agaaacttcc ggagccagag    840
ctggcgttga aagaagagaa tgtcgcggtc gcgagctcag agagtgaagt gaaggtagaa    900
acgagcagcg aagcatggtc aatttaa                                        927
<210>32
<211>984
<212>DNA
<213>授粉熊蜂(Bombus terrestris)
<400>32
atgaagattc cagcactgct cgtaacgtgc ctctaccttt ggggcttcgc gtccgccggc     60
cagagctcac ctctgctcga gatcgtgcag ggtagcgcgt cggccaccgc atccaccgct    120
gtgaccgcta gatccggact tcgtgccggt caggtagccg tggcctcgca gaaggatgcc    180
acacttcagg cagatgcctc agcggccgcc gcggccgctg cacgcgcttc cgccgaccag    240
tcggccagtc tagcccaaca gtcggcgtct ttgcagtcca aagctgccgc cagagcaaaa    300
tcagccgagg agtcagcggc agctacggcc aaagccgagt tgcaggcaga atccattgct    360
gcatctgcca gttccaatgc cagagaggct gcagcgtccg caaaagcctc cgcatccgcg    420
atgtcatcgg ctgccgtgca ggcgaaactc gctgaaaaga cggccaagaa tcaagctctg    480
gcttccgaag aagccaaact caaggctgcc gccgctgcca gcgcagcagc agcagccagc    540
gccgccgccg aggcagccct gaaagctgag agaatagcgg aagaagccat cgccaaggcg    600
gccgctgcca aagcagccgc cagagccgct gcagccgcgt taaactccgc gaaggaagcc    660
gccacgagca gcgcaaggag cgccgccgaa gccgaagcta agagcgaagt cgctatactg    720
atcagcgaac tcgacaagaa gagcagggaa gtcgccgctt ccgcgtccgc caaggcacgc    780
gctgctgctg cggctagctc cagaaacgca gaaacggctg ttatcggagc taacatcaat    840
gtggccaaag aggtcttggc gattcccatc gagccaaaga aacttccgga gccagagctg    900
gcgttgaaag aagagaatgt cgcggtcgcg agctcagaga gtgaagtgaa ggtagaaacg    960
agcagcgaag catggtcaat ttaa                                           984
<210>33
<211>882
<212>DNA
<213>授粉熊蜂(Bombus terrestris)
<400>33
cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat     60
gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag    120
aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc    180
aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct    240
atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc    300
gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc    360
gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag    420
gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc    480
gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct    540
aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa    600
gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct    660
accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc    720
gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc    780
gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg    840
tttagcgaag atcgattaaa cgagagacaa gacaattggt ag                       882
<210>34
<211>942
<212>DNA
<213>授粉熊蜂(Bombus terrestris)
<400>34
atgaagattc cagcaatact ggttacgtct ctgctggtct ggggtggtct ggccgagggc     60
cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat    120
gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag    180
aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc    240
aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct    300
atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc    360
gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc    420
gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag    480
gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc    540
gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct    600
aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa    660
gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct    720
accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc    780
gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc    840
gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg    900
tttagcgaag atcgattaaa cgagagacaa gacaattggt ag                       942
<210>35
<211>942
<212>DNA
<213>授粉熊蜂(Bombus terrestris)
<400>35
ggtagcgtgg aactcggtgc ccccaagcag gagtctgtcc tcgtggagca gctcctattg     60
aagaacgtgg agactagtgc gaagcgaaag gagaacggcg caccgaaact cggcgagagc    120
acagctgcgg ctctggctag taccaaggca actgcagccg cagaggctaa ggcatccgcc    180
aaagtgaaag cttctgcctt ggccctcgct gaggctttct tgcgtgcgtc ggcagcgttt    240
gctgctgctt cagccaaagc tgctgccgct gtaaaggaag caacgcaggc acagttgctg    300
gcacaggaga aggctttgat agcgttgaaa actcaatctg agcaacaagc tgcctctgct    360
cgcgcggacg ccgcggctgc cgcagccgta tccgcgctag aacgcgccca ggcctcctcc    420
agagcagcca cgaccgccca agacatctcc agcgatctgg agaaacgtgt cgccacctca    480
gccgctgctg aagcaggtgc caccctcaga gcggaacaat ccgccgcgca atcgaaatgg    540
tccgccgcac tggccgccca aaccgccgct gctgcagccg ctatagaagc aaaggccacc    600
gcttcctcag aaagcaccgc tgccgctact agtaaggccg ccgtgttgac cgctgacact    660
agcagcgcag aagctgccgc tgcagcggag gcacaatccg cttcgcggat cgcaggtaca    720
gcagccaccg agggatccgc caactgggct agcgagaact cgcgtaccgc acaactggaa    780
gcttccgcct cagcgaaggc caccgcagcc gcagctgtcg gagatggagc tattatagga    840
cttgcacggg acgctagtgc cgcagctcag gcagccgcag aagttaaagc cttagctgaa    900
gctagtgcca gcttaggtgc ttcagaaaag gacaagaaat ga                       942
<210>36
<211>999
<212>DNA
<213>授粉熊蜂(Bombus terrestris)
<400>36
atgcagatcc cagcgatttt cgtcacgtgc ctgctcacat ggggcctggt gcacgcaggt     60
agcgtggaac tcggtgcccc caagcaggag tctgtcctcg tggagcagct cctattgaag    120
aacgtggaga ctagtgcgaa gcgaaaggag aacggcgcac cgaaactcgg cgagagcaca    180
gctgcggctc tggctagtac caaggcaact gcagccgcag aggctaaggc atccgccaaa    240
gtgaaagctt ctgccttggc cctcgctgag gctttcttgc gtgcgtcggc agcgtttgct    300
gctgcttcag ccaaagctgc tgccgctgta aaggaagcaa cgcaggcaca gttgctggca    360
caggagaagg ctttgatagc gttgaaaact caatctgagc aacaagctgc ctctgctcgc    420
gcggacgccg cggctgccgc agccgtatcc gcgctagaac gcgcccaggc ctcctccaga    480
gcagccacga ccgcccaaga catctccagc gatctggaga aacgtgtcgc cacctcagcc    540
gctgctgaag caggtgccac cctcagagcg gaacaatccg ccgcgcaatc gaaatggtcc    600
gccgcactgg ccgcccaaac cgccgctgct gcagccgcta tagaagcaaa ggccaccgct    660
tcctcagaaa gcaccgctgc cgctactagt aaggccgccg tgttgaccgc tgacactagc    720
agcgcagaag ctgccgctgc agcggaggca caatccgctt cgcggatcgc aggtacagca    780
gccaccgagg gatccgccaa ctgggctagc gagaactcgc gtaccgcaca actggaagct    840
tccgcctcag cgaaggccac cgcagccgca gctgtcggag atggagctat tataggactt    900
gcacgggacg ctagtgccgc agctcaggca gccgcagaag ttaaagcctt agctgaagct    960
agtgccagct taggtgcttc agaaaaggac aagaaatga                           999
<210>37
<211>1017
<212>DNA
<213>授粉熊蜂(Bombus terrestris)
<400>37
ggcaaaccac tcattgccaa tgcgcaaata gggaaggtca agaccgaaac gtcatcgtct     60
tcagagattg agacgttggt atcaggaagc cagacattgg tggcaggaag tgagacattg    120
gcttcagaaa gcgaggcatt ggcgtcaaaa agcgaggcat tgacgtcaga agccgagata    180
gcgagcgtga caacgaagga cgagctcata ctaaagggcg aagctatcac tggaaagaaa    240
ctaggaaccg gggcgtcgga agtagcggcg gcctctgggg aggctatcgc aactaccctt    300
ggcgcgggac aagctgcagc agaggcacaa gcagccgccg ccgcgcaagc aaaatcagca    360
gcggcagctg ccgcgaatgc aggtgaatcc agcaacagtg ctgctgcgtt ggttgctgct    420
gcagctgcag cacaaggaaa agcggctgcc gccgcagcag ccgcgacgaa ggctagctta    480
gaggccgcag acgctgctga ggaagctgag tcggccgtgg ccttggctag ggctgcctcc    540
gcaaaggcgg aagcgctcgc atcgaccgcc gctgctgcga atacccgtgc tgctctccaa    600
gcggaaaaat cgaacgagct ggcgcaagct gaggctgcag ccgccgccga agcccaggct    660
aaagccgccg ctgctgccaa ggcaacacaa ctcgccctta aagttgccga aactgcggtg    720
aaaacggaag cagatgcagc agctgccgcc gttgcggccg caaaagccag agcagtcgca    780
gacgcagccg cgtctcgtgc gaccgcagtg aacgccattg ctgaagcgga agaaagagac    840
tctgcacagg cggagaacac cgctggtgta gcacaagcag cgctcgctgc tgcggaagca    900
caagactcct gcatcggcgc tgccgcgact cctaggcatt cgtcgagcta tgcatggtgg    960
aagcttagga taacatcctt gatcgtcatt ctatcgccac gcaatcgacg tacttaa      1017
<210>38
<211>1074
<212>DNA
<213>授粉熊蜂(Bombus terrestris)
<400>38
atgaagattc catcgatact cgcggtgtcc ctgctggttt ggggtctggc cagcgcaggc     60
aaaccactca ttgccaatgc gcaaataggg aaggtcaaga ccgaaacgtc atcgtcttca    120
gagattgaga cgttggtatc aggaagccag acattggtgg caggaagtga gacattggct    180
tcagaaagcg aggcattggc gtcaaaaagc gaggcattga cgtcagaagc cgagatagcg    240
agcgtgacaa cgaaggacga gctcatacta aagggcgaag ctatcactgg aaagaaacta    300
ggaaccgggg cgtcggaagt agcggcggcc tctggggagg ctatcgcaac tacccttggc    360
gcgggacaag ctgcagcaga ggcacaagca gccgccgccg cgcaagcaaa atcagcagcg    420
gcagctgccg cgaatgcagg tgaatccagc aacagtgctg ctgcgttggt tgctgctgca    480
gctgcagcac aaggaaaagc ggctgccgcc gcagcagccg cgacgaaggc tagcttagag    540
gccgcagacg ctgctgagga agctgagtcg gccgtggcct tggctagggc tgcctccgca    600
aaggcggaag cgctcgcatc gaccgccgct gctgcgaata cccgtgctgc tctccaagcg    660
gaaaaatcga acgagctggc gcaagctgag gctgcagccg ccgccgaagc ccaggctaaa    720
gccgccgctg ctgccaaggc aacacaactc gcccttaaag ttgccgaaac tgcggtgaaa    780
acggaagcag atgcagcagc tgccgccgtt gcggccgcaa aagccagagc agtcgcagac    840
gcagccgcgt ctcgtgcgac cgcagtgaac gccattgctg aagcggaaga aagagactct    900
gcacaggcgg agaacaccgc tggtgtagca caagcagcgc tcgctgctgc ggaagcacaa    960
gactcctgca tcggcgctgc cgcgactcct aggcattcgt cgagctatgc atggtggaag   1020
cttaggataa catccttgat cgtcattcta tcgccacgca atcgacgtac ttaa         1074
<210>39
<211>1411
<212>DNA
<213>授粉熊蜂(Bombus terrestris)
<400>39
ggaaattcgg aaagcggcga aaattggaag aacggtgaaa gctccgaaag cggcaaaaat     60
tggaggaaca gcggaagctc cgaaagcggc aaaaattgga agaatggcgg aagctcagaa    120
agcaacaaac attggaagaa cggtggaagc tcggaaagcg gcgagaaatg gaaaaacagt    180
gaaagctccg aaagcggcaa aaattggaag aacagcggaa gctccgaaag cggcaaaaat    240
tggaaaaacg gcggaagctc ggaaagcaac aaacattgga agagcggtgg aagctcggaa    300
agtggcgaga aatggaaaaa cagtgaaagc ggaaataaag gcaaaagctc aaaaagcagc    360
gaaagttgga agagcaacga aaactcgaag aacgacggca gctggaagag cagtgaagaa    420
tcagaaaagt ggaaagatgg taaagcagtg gcggaagaca gcgttagtat aaactgggca    480
gatgtcaaag agcagattag caacattgct acatccttag aaaagggtgg taacctcgag    540
gctgtattga aaataaagaa aggagaaaag aaaatttcaa gtttggagga aatcaaggag    600
aaaatctctg tcctactgaa atggattcaa gaaggcaaag atactagcag cctattagat    660
ttgaaagagg gtagcaagga tattgcgtcg ttgaaagaaa tcaaaggaaa gatccttttg    720
attgttaaat tagtgaacga agggaaagac actagtggtc ttttagattt agaagcgagt    780
ggcaaagtaa ttttagaatt gcaaagcgcc atagaaaagg ttctcgtaaa gtcagaaaag    840
gtaaccaaag tatctgaagt ttccggttta gtaaaaagca aaactgtctc ggacataaaa    900
ccgcttcaag cagtaattcc tttaatcctt gaattgcaaa aaacagacat taaccttagt    960
accttaaaca agtggtccac tgttaacgta aattctatag ataaagaacg cgtcacgaaa   1020
acggttccag tgctccttca atccatgaaa ggaggcgaag atattcagaa ccttttgagt   1080
gcgaaaggtg caaagaaact tggcattagt gctttggact tacaggcagt tcaaggagct   1140
cttggcgtgg ttggaaagct aagttcaggt ggtgcgttga actcaaaagg cttgttgaac   1200
ttgaaagacg gcgctagtgt gttaggtgca ggaaaaatcg gaggattaat tcctttaccg   1260
aaactttaag agatagaccg ataaaggcag atatactctc ggaagatttt tttggaagtt   1320
gaatagtccg caaaaaaatt atctctgatt attataattt agcctaaaat attaaataaa   1380
atggagaaat aacgttgaaa tatataaata a                                  1411
<210>40
<211>403
<212>PRT
<213>牛头犬蚁(Myrmecia forficata)
<400>40
Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser Ala Ser Ala
1               5                   10                  15
Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys Ser Gly Ala
            20                  25                  30
Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile Leu Ser Arg
        35                  40                  45
Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser Ala Ala Val
    50                  55                  60
Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala Glu Glu Gln
65                  70                  75                  80
Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys Asn Ala Glu
                85                  90                  95
Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln Gly Ser Ala
            100                 105                 110
Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val Glu Glu Glu
        115                 120                 125
Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val Ala Ala Ala
    130                 135                 140
Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala Gln Thr Ala
145                 150                 155                 160
Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr Ala Leu Lys
                165                 170                 175
Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala Arg Met Met
            180                 185                 190
Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala Ala Gln Gln
        195                 200                 205
Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala Ile Ala Ala
    210                 215                 220
Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala Lys Ala Ala
225                 230                 235                 240
Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln Ala Asn Ala
                245                 250                 255
Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser Lys Ser Arg
            260                 265                 270
Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala Ser Lys Ser
        275                 280                 285
Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu Phe Gly Lys
    290                 295                 300
Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn Gly Gly Gln
305                 310                 315                 320
Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser Ala Val Gly
                325                 330                 335
Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp Ser Arg Val
            340                 345                 350
Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala Asp Ala Ser
        355                 360                 365
Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly Leu Gly Ser
    370                 375                 380
Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser Ala Gly Thr
385                 390                 395                 400
Leu Leu Leu
<210>41
<211>422
<212>PRT
<213>牛头犬蚁(Myrmecia forficata)
<400>41
Met Lys Ile Pro Ala Ile Ile Ala Thr Ser Leu Leu Leu Trp Gly Phe
1               5                   10                  15
Ala Ser Ala Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser
            20                  25                  30
Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys
        35                  40                  45
Ser Gly Ala Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile
    50                  55                  60
Leu Ser Arg Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser
65                  70                  75                  80
Ala Ala Val Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala
                85                  90                  95
Glu Glu Gln Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys
            100                 105                 110
Asn Ala Glu Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln
        115                 120                 125
Gly Ser Ala Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val
    130                 135                 140
Glu Glu Glu Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val
145                 150                 155                 160
Ala Ala Ala Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala
                165                 170                 175
Gln Thr Ala Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr
            180                 185                 190
Ala Leu Lys Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala
        195                 200                 205
Arg Met Met Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala
    210                 215                 220
Ala Gln Gln Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala
225                 230                 235                 240
Ile Ala Ala Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala
                245                 250                 255
Lys Ala Ala Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln
            260                 265                 270
Ala Asn Ala Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser
        275                 280                 285
Lys Ser Arg Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala
    290                 295                 300
Ser Lys Ser Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu
305                 310                 315                 320
Phe Gly Lys Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn
                325                 330                 335
Gly Gly Gln Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser
            340                 345                 350
Ala Val Gly Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp
        355                 360                 365
Ser Arg Val Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala
    370                 375                 380
Asp Ala Ser Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly
385                 390                 395                 400
Leu Gly Ser Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser
                405                 410                 415
Ala Gly Thr Leu Leu Leu
            420
<210>42
<211>392
<212>PRT
<213>牛头犬蚁(Myrmecia forficata)
<400>42
Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala Ser Ala Ser
1               5                   10                  15
Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly Lys Leu Glu
            20                  25                  30
Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu Glu Ser Leu
        35                  40                  45
Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly Leu Asp Val
    50                  55                  60
Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp Val Ala Thr
65                  70                  75                  80
Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly Pro Val Ala
                85                  90                  95
Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr Ser Ala Gln
            100                 105                 110
Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile Ala Ala Met
        115                 120                 125
Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val Thr Thr Lys
    130                 135                 140
Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala Arg Ala Thr
145                 150                 155                 160
Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser Ala Ala Ser
                165                 170                 175
Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala Ala Ser Ile
            180                 185                 190
Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala Ala Val Leu
        195                 200                 205
Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys Ser Leu Ser
    210                 215                 220
Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala Glu Ala Ser
225                 230                 235                 240
Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala Val Ala Arg
                245                 250                 255
Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln Ala Ala Ser
            260                 265                 270
Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala Ser Ala Gln
        275                 280                 285
Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr Ala Asp Ala
    290                 295                 300
Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu Lys Asn Asp
305                 310                 315                 320
Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala Glu Gly Glu
                325                 330                 335
Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg Ser Gly Ser
            340                 345                 350
Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser Met Gly Gly
        355                 360                 365
Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala Gly Ala Ser
    370                 375                 380
Ala Gly Ser Ser Ala Asp Ser Leu
385                 309
<210>43
<211>411
<212>PRT
<213>牛头犬蚁(Myrmecia forficata)
<400>43
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Ala Trp Gly Leu
1               5                   10                  15
Ala Ser Gly Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala
            20                  25                  30
Ser Ala Ser Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly
        35                  40                  45
Lys Leu Glu Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu
    50                  55                  60
Glu Ser Leu Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly
65                  70                  75                  80
Leu Asp Val Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp
                85                  90                  95
Val Ala Thr Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly
            100                 105                 110
Pro Val Ala Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr
        115                 120                 125
Ser Ala Gln Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile
    130                 135                 140
Ala Ala Met Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val
145                 150                 155                 160
Thr Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala
                165                 170                 175
Arg Ala Thr Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser
            180                 185                 190
Ala Ala Ser Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala
        195                 200                 205
Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala
    210                 215                 220
Ala Val Leu Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys
225                 230                 235                 240
Ser Leu Ser Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala
                245                 250                 255
Glu Ala Ser Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala
            260                 265                 270
Val Ala Arg Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln
        275                 280                 285
Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala
    290                 295                 300
Ser Ala Gln Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr
305                 310                 315                 320
Ala Asp Ala Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu
                325                 330                 335
Lys Asn Asp Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala
            340                 345                 350
Glu Gly Glu Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg
        355                 360                 365
Ser Gly Ser Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser
    370                 375                 380
Met Gly Gly Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala
385                 390                 395                 400
Gly Ala Ser Ala Gly Ser Ser Ala Asp Ser Leu
                405                 410
<210>44
<211>375
<212>PRT
<213>牛头犬蚁(Myrmecia forficata)
<400>44
Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser Ala Ser Ala
1               5                   10                  15
Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu Pro Leu Pro
            20                  25                  30
Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val Phe Asp Ile
        35                  40                  45
Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly Ala Pro Lys
    50                  55                  60
Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu Arg Ala Glu
65                  70                  75                  80
Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile Lys Lys Ile
                85                  90                  95
Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp Ala Ser Ala
            100                 105                 125
Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala Gln Ala Ser
        115                 120                 125
Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu Ala Leu Ser
    130                 135                 140
Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala Ala Ala Thr
145                 150                 155                 160
Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala Ala Asn Ala
                165                 170                 175
Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn Arg Ser Ala
            180                 185                 190
Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala Ser Ala Leu
        195                 200                 205
Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala Ala Ala Ser
    210                 215                 220
Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr Ala Arg Ala
225                 230                 235                 240
Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser Ala Gln Glu
                245                 250                 255
Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu Glu Lys Ala
            260                 265                 270
Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr Tyr Thr Ala
        275                 280                 285
Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile Asn Ala Leu
    290                 295                 300
Arg Asp Gly Ile Val Val Gly Mer Gly Asn Asp Ala Gly Ala Ser Ala
305                 310                 315                 320
Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser Glu His Lys
                325                 330                 335
Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr Gly Ser Lys
            340                 345                 350
Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser
        355                 360                 365
Ser Arg Leu Gly Lys Asp Trp
    370                 375
<210>45
<211>394
<212>PRT
<213>牛头犬蚁(Myrmecia forficata)
<400>45
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu
1               5                   10                  15
Ala Ser Gly Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser
            20                  25                  30
Ala Ser Ala Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu
        35                  40                  45
Pro Leu Pro Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val
    50                  55                  60
Phe Asp Ile Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly
65                  70                  75                  80
Ala Pro Lys Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu
                85                  90                  95
Arg Ala Glu Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile
            100                 105                 110
Lys Lys Ile Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp
        115                 120                 125
Ala Ser Ala Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala
    130                 135                 140
Gln Ala Ser Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu
145                 150                 155                 160
Ala Leu Ser Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala
                165                 170                 175
Ala Ala Thr Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala
            180                 185                 190
Ala Asn Ala Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn
        195                 200                 205
Arg Ser Ala Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala
    210                 215                 220
Ser Ala Leu Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala
225                 230                 235                 240
Ala Ala Ser Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr
                245                 250                 255
Ala Arg Ala Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser
            260                 265                 270
Ala Gln Glu Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu
        275                 280                 285
Glu Lys Ala Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr
    290                 295                 300
Tyr Thr Ala Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile
305                 310                 315                 320
Asn Ala Leu Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly
                325                 330                 335
Ala Ser Ala Gln Ala Met Ala Gln Val Glu Ala Leu Ala Ar  Ala Ser
            340                 345                 350
Glu His Lys Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr
        355                 360                 365
Gly Ser Lys Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala
    370                 375                 380
Glu Ala Ser Ser Arg Leu Gly Lys Asp Trp
385                 390
<210>46
<211>422
<212>PRT
<213>牛头犬蚁(Myrmecia forficata)
<400>46
Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala Gln Ala Glu
1               5                   10                  15
Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser Gln Ala Ser
            20                  25                  30
Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly Gly Ser Lys
        35                  40                  45
Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser Glu Ala Lys
    50                  55                  60
Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly Thr Gly Ile
65                  70                  75                  80
Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly Leu Gly
                85                  90                  95
Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly Gln Ala
            100                 105                 110
Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr Thr Ala Lys
        115                 120                 125
Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile Glu Val Ala
    130                 135                 140
Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala Ala Lys Ala
145                 150                 155                 160
Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala Ala Ala Gly
                165                 170                 175
Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu Arg Arg Ala
            180                 185                 190
Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala Ser Ser Ala
        195                 200                 205
Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg Glu Ala Ala
    210                 215                 220
Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile Glu Gln Glu
225                 230                 235                 240
Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu Asn Ala Glu
                245                 250                 255
Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala Ser Ala Glu
            260                 265                 270
Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val Ala Arg Ala
        275                 280                 285
Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr Asp Ala Gly
    290                 295                 300
Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys Gly Glu Leu
305                 310                 315                 320
Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn Ala Asp Leu
                325                 330                 335
Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly Gln Val Gln
            340                 345                 350
Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly Trp Gly Lys
        355                 360                 365
Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg Ala Ser Ala
    370                 375                 380
Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp Gly Arg Gln
385                 390                 395                 400
Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu Ala Asp Ser
                405                 410                 415
Gln Leu Leu Lys Val Trp
            420
<210>47
<211>441
<212>PRT
<213>牛头犬蚁(Myrmecia forficata)
<400>47
Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Leu Ile Trp Gly Leu
1               5                   10                  15
Val Gly Ala Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala
            20                  25                  30
Gln Ala Glu Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser
        35                  40                  45
Gln Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly
    50                  55                  60
Gly Ser Lys Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser
65                  70                  75                  80
Glu Ala Lys Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly
                85                  90                  95
Thr Gly Ile Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg
            100                 105                 110
Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala
        115                 120                 125
Gly Gln Ala Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr
    130                 135                 140
Thr Ala Lys Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile
145                 150                 155                 160
Glu Val Ala Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala
                165                 170                 175
Ala Lys Ala Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala
            180                 185                 190
Ala Ala Gly Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu
        195                 200                 205
Arg Arg Ala Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala
    210                 215                 220
Ser Ser Ala Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg
225                 230                 235                 240
Glu Ala Ala Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile
                245                 250                 255
Glu Gln Glu Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu
            260                 265                 270
Asn Ala Glu Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala
        275                 280                 285
Ser Ala Glu Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val
    290                 295                 300
Ala Arg Ala Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr
305                 310                 315                 320
Asp Ala Gly Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys
                325                 330                 335
Gly Glu Leu Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn
            340                 345                 350
Ala Asp Leu Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly
        355                 360                 365
Gln Val Gln Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly
    370                 375                 380
Trp Gly Lys Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg
385                 390                 395                 400
Ala Ser Ala Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp
                405                 410                 415
Gly Arg Gln Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu
            420                 425                 430
Ala Asp Ser Gln Leu Leu Lys Val Trp
        435                 440
<210>48
<211>1212
<212>DNA
<213>牛头犬蚁(Myrmecia forficata)
<400>48
agcgggccgc gcttactcgg cggcagatcg gccgcgtccg cgtcggcttc cgcttcggct     60
gaggcgtcgg cgggcggttg gaggaaaagc ggcgcatccg cttccgcttc cgctaaggct    120
ggtagcagca acatcctcag ccgcgtggga gcttcgaggg cggccgcgac gttggtcgct    180
tccgccgcgg tggaggccaa ggcgggtctc cgtgccggca aggcaaccgc cgaggagcag    240
agggaggctt tggaaatgct caccttgtcc gccgacaaga atgccgaggc gcgtatcctg    300
gccgacgaca cggccgttct ggttcaaggc agcgccgagg cacagtcggt cgccgccgcg    360
aagaccgtcg cggtcgagga agagtccgct tccttggatg cggccgcagt tgaagcggag    420
gtcgcagccg ccacgtcgaa atcgtcggct ggccaagcac tccagtccgc acagaccgcc    480
gcatctgctc tcagaacttc cgccaggagc gccttgacgg ccctcaagct ggcacgcctc    540
caaggcgcgg cttctagcaa cgctgccagg atgatggaaa aggcgctggc cgccacccag    600
gacgcaaatg ccgccgccca gcaagctatg gcggccgaga gtgcagccgc agaagcagcg    660
gctatcgcgg cagcgaaaca atcggaggcg agagacgccg gcgccgaggc caaggccgcc    720
atggcagcac tcatcaccgc ccagaggaat ctcgtgcagg ccaatgccag ggcggaaatg    780
gcaagcgagg aagccgaatt ggattcgaag tctagagcgt ccgacgccaa ggtgaacgcc    840
gttgctcgtg cggcctccaa gtccagcata cgcagagatg aacttatcga gatcggcgct    900
gagttcggca aggccagcgg cgaggtgatt tccaccggca cgcgttccaa cggcggtcaa    960
gacgccatcg ccaccgccga ggcatcgagt agcgcgtccg ccgtcggcat caagaaaaca   1020
agcggacact gggggagcgg aaaatggagt cgtgtctcca agggtaaagg atgggcttcc   1080
tcgaatgcgg acgctgacgc cagcagcagc agcatcatca tcggcggtct caaacgcggc   1140
ggcctcggtt cggaagcctc tgcggcagct tccgcagaag cggaagcttc cgccggcaca   1200
ctcctgctgt aa                                                       1212
<210>49
<211>1269
<212>DNA
<213>牛头犬蚁(Myrmecia forficata)
<400>49
atgaagatcc cagcgataat cgcaacgtcc cttctcctct ggggtttcgc cagcgccagc     60
gggccgcgct tactcggcgg cagatcggcc gcgtccgcgt cggcttccgc ttcggctgag    120
gcgtcggcgg gcggttggag gaaaagcggc gcatccgctt ccgcttccgc taaggctggt    180
agcagcaaca tcctcagccg cgtgggagct tcgagggcgg ccgcgacgtt ggtcgcttcc    240
gccgcggtgg aggccaaggc gggtctccgt gccggcaagg caaccgccga ggagcagagg    300
gaggctttgg aaatgctcac cttgtccgcc gacaagaatg ccgaggcgcg tatcctggcc    360
gacgacacgg ccgttctggt tcaaggcagc gccgaggcac agtcggtcgc cgccgcgaag    420
accgtcgcgg tcgaggaaga gtccgcttcc ttggatgcgg ccgcagttga agcggaggtc    480
gcagccgcca cgtcgaaatc gtcggctggc caagcactcc agtccgcaca gaccgccgca    540
tctgctctca gaacttccgc caggagcgcc ttgacggccc tcaagctggc acgcctccaa    600
ggcgcggctt ctagcaacgc tgccaggatg atggaaaagg cgctggccgc cacccaggac    660
gcaaatgccg ccgcccagca agctatggcg gccgagagtg cagccgcaga agcagcggct    720
atcgcggcag cgaaacaatc ggaggcgaga gacgccggcg ccgaggccaa ggccgccatg    780
gcagcactca tcaccgccca gaggaatctc gtgcaggcca atgccagggc ggaaatggca    840
agcgaggaag ccgaattgga ttcgaagtct agagcgtccg acgccaaggt gaacgccgtt    900
gctcgtgcgg cctccaagtc cagcatacgc agagatgaac ttatcgagat cggcgctgag    960
ttcggcaagg ccagcggcga ggtgatttcc accggcacgc gttccaacgg cggtcaagac   1020
gccatcgcca ccgccgaggc atcgagtagc gcgtccgccg tcggcatcaa gaaaacaagc   1080
ggacactggg ggagcggaaa atggagtcgt gtctccaagg gtaaaggatg ggcttcctcg   1140
aatgcggacg ctgacgccag cagcagcagc atcatcatcg gcggtctcaa acgcggcggc   1200
ctcggttcgg aagcctctgc ggcagcttcc gcagaagcgg aagcttccgc cggcacactc   1260
ctgctgtaa                                                           1269
<210>50
<211>1179
<212>DNA
<213>牛头犬蚁(Myrmecia forficata)
<400>50
cgggtcatcg agtccagctc gtcggcttcc gcacaggcgt cggcatcggc cggctcgaga     60
ggcctgctcg gtaaacggcc gattggcaag ctcgagtggg gcaaggagga gaagaaactc    120
gaagaactcg acgaggaatc gctcaatgag gccgctctga aggtcggcat caagaacggc    180
ggattggatg tcgcgaaggg cgcggcagtc ctcgaggcag cgatgagcga cgtcgcgacc    240
cttacggatc agcgttctct tgtggatctc ggtctcggcc cggtcgcgaa cgaggccgag    300
atcctggcgg aggcgcaggc cgccacgagc gcccaagctg gcgctgtcgc taatagcgcc    360
gcggagcgtg cgatcgcggc gatggagatg gccgacagaa ccgaatatat tgcggcactt    420
gtcaccacca aagccgccaa agctgccgag gccactatgg ccgctactgc ccgtgccacc    480
gccgccgcct cagcctccaa gatatccagt caggaatcag ccgcatcggc cgctaacgcc    540
gccaacgccg aagccaaggc caacgccgct tccataatcg ctaacaaggc gaacgccgtc    600
ctggctgagg ccgccgccgt actcgcagcc actgctgcca aggccaagga atcggcgatg    660
aaatcgctta gcgccgctca ggccgccgcc aaggcacaag ccaggaacgc cgaggcctcc    720
gccgaagctc agatcaaact ttcccaggcc agggccgccg tggcacgcgc tgcagccgat    780
caggccgtct gttcctccca ggctcaggcc gcaagtcaga tacaatcgag ggcatccgca    840
tccgaatccg cggcatcggc acaatcagag accaacaccg ccgcggccga agcggtcgcc    900
accgctgacg ccgaagcggc cgcgcaagct gaagcgtggg tcatgtcgct gaagaacgat    960
ctgtggctgc atctcaacat gaagggtgag gccaaggccg aaggcgaggc cgtttcgatc   1020
agcaaaggac atcgcggcgg tatcaggtcg ggcagcatct cggaagccag cgccgaggca   1080
agcagcaacg tttccatggg cggacgtcat ggacggaagg acctcgtctc tgaagcgtta   1140
gcgggagcat cagcgggcag cagtgccgac tccctttga                          1179
<210>51
<211>1236
<212>DNA
<213>牛头犬蚁(Myrmecia forficata)
<400>51
atgaagattc cagcgatact cgtgacgtct ctcctcgcct ggggattagc cagcggccgg     60
gtcatcgagt ccagctcgtc ggcttccgca caggcgtcgg catcggccgg ctcgagaggc    120
ctgctcggta aacggccgat tggcaagctc gagtggggca aggaggagaa gaaactcgaa    180
gaactcgacg aggaatcgct caatgaggcc gctctgaagg tcggcatcaa gaacggcgga    240
ttggatgtcg cgaagggcgc ggcagtcctc gaggcagcga tgagcgacgt cgcgaccctt    300
acggatcagc gttctcttgt ggatctcggt ctcggcccgg tcgcgaacga ggccgagatc    360
ctggcggagg cgcaggccgc cacgagcgcc caagctggcg ctgtcgctaa tagcgccgcg    420
gagcgtgcga tcgcggcgat ggagatggcc gacagaaccg aatatattgc ggcacttgtc    480
accaccaaag ccgccaaagc tgccgaggcc actatggccg ctactgcccg tgccaccgcc    540
gccgcctcag cctccaagat atccagtcag gaatcagccg catcggccgc taacgccgcc    600
aacgccgaag ccaaggccaa cgccgcttcc ataatcgcta acaaggcgaa cgccgtcctg    660
gctgaggccg ccgccgtact cgcagccact gctgccaagg ccaaggaatc ggcgatgaaa    720
tcgcttagcg ccgctcaggc cgccgccaag gcacaagcca ggaacgccga ggcctccgcc    780
gaagctcaga tcaaactttc ccaggccagg gccgccgtgg cacgcgctgc agccgatcag    840
gccgtctgtt cctcccaggc tcaggccgca agtcagatac aatcgagggc atccgcatcc    900
gaatccgcgg catcggcaca atcagagacc aacaccgccg cggccgaagc ggtcgccacc    960
gctgacgccg aagcggccgc gcaagctgaa gcgtgggtca tgtcgctgaa gaacgatctg   1020
tggctgcatc tcaacatgaa gggtgaggcc aaggccgaag gcgaggccgt ttcgatcagc   1080
aaaggacatc gcggcggtat caggtcgggc agcatctcgg aagccagcgc cgaggcaagc   1140
agcaacgttt ccatgggcgg acgtcatgga cggaaggacc tcgtctctga agcgttagcg   1200
ggagcatcag cgggcagcag tgccgactcc ctttga                             1236
<210>52
<211>1128
<212>DNA
<213>牛头犬蚁(Myrmecia forficata)
<400>52
aatctcctta aggagtcgaa agcttccgcg tccgcgtccg cgtccgcttc cgcgagggcc     60
agcggcaaga agaatcttca cgtgttgcca ttaccgaaga aaagcgagca tggcatcgtg    120
atcgacaagt cggtgttcga catcaaggat gtagtgctga gcgcggtcga cgagatcaac    180
ggcgccccga aactcggcct gggatggaag aaggtcagca tgggggtgga gcgcgccgag    240
gcgaacgcag ccgctgccgc cgaggcattg gcgatgatca agaagattgc catggcccgc    300
agcagtgcat acgtccaggc ggcctgggca tcggcccagg catcagctga cgcattggct    360
agcgccaggg tggcacaggc gtctcaggag gctgcggagg caaagggtag agcggcttcc    420
gaggcgctct ccagagccat cgaagcatcc tcgcgagccg atgcggcagc cgctgcgacg    480
ctggacgcga tggaccgcac catggagaac gcgagggcgg caaatgccgc gcaaacgcag    540
gccagcggcc aagctgagaa cgcaaatcgc agcgctgctg ccatcctcgc agctctgcta    600
cgtatcgcgg aggcatccgc gttgaacaac gaggccgcgg tcaacgcggc cgcggccgca    660
gccgcagcgt ctgcccttca ggccaaggct aacgcggctt ctcaagcaac cgccagagcc    720
gcaggacagg cgtcgacggc cgccgaagag gcgcaatccg cccaagaagc cgccgataag    780
aacgcggagc tgaccacggt catgctcgaa aaggctagtg ctgatcaaca ggcggcatcc    840
gctagggctg actactacac cgcctcaacc gaggccgaag ccgctgcaca ggcgtctgct    900
atcaacgcac tcagggacgg aatagttgtc ggaatgggaa atgacgctgg cgcatcggcc    960
caagcgatgg cacaggtaga agctctcgct cgcgccagcg agcacaaggc gttaggcgag   1020
aagaagaagg gcctggtttg gggctacgga agcaagggca gtagctccgc cagcgcatcc   1080
gccagcgcct ccgccgaagc atcctcgaga ctcggaaagg actggtag                1128
<210>53
<211>1185
<212>DNA
<213>牛头犬蚁(Myrmecia forficata)
<400>53
atgaagatac cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggaat     60
ctccttaagg agtcgaaagc ttccgcgtcc gcgtccgcgt ccgcttccgc gagggccagc    120
ggcaagaaga atcttcacgt gttgccatta ccgaagaaaa gcgagcatgg catcgtgatc    180
gacaagtcgg tgttcgacat caaggatgta gtgctgagcg cggtcgacga gatcaacggc    240
gccccgaaac tcggcctggg atggaagaag gtcagcatgg gggtggagcg cgccgaggcg    300
aacgcagccg ctgccgccga ggcattggcg atgatcaaga agattgccat ggcccgcagc    360
agtgcatacg tccaggcggc ctgggcatcg gcccaggcat cagctgacgc attggctagc    420
gccagggtgg cacaggcgtc tcaggaggct gcggaggcaa agggtagagc ggcttccgag    480
gcgctctcca gagccatcga agcatcctcg cgagccgatg cggcagccgc tgcgacgctg    540
gacgcgatgg accgcaccat ggagaacgcg agggcggcaa atgccgcgca aacgcaggcc    600
agcggccaag ctgagaacgc aaatcgcagc gctgctgcca tcctcgcagc tctgctacgt    660
atcgcggagg catccgcgtt gaacaacgag gccgcggtca acgcggccgc ggccgcagcc    720
gcagcgtctg cccttcaggc caaggctaac gcggcttctc aagcaaccgc cagagccgca    780
ggacaggcgt cgacggccgc cgaagaggcg caatccgccc aagaagccgc cgataagaac    840
gcggagctga ccacggtcat gctcgaaaag gctagtgctg atcaacaggc ggcatccgct    900
agggctgact actacaccgc ctcaaccgag gccgaagccg ctgcacaggc gtctgctatc    960
aacgcactca gggacggaat agttgtcgga atgggaaatg acgctggcgc atcggcccaa   1020
gcgatggcac aggtagaagc tctcgctcgc gccagcgagc acaaggcgtt aggcgagaag   1080
aagaagggcc tggtttgggg ctacggaagc aagggcagta gctccgccag cgcatccgcc   1140
agcgcctccg ccgaagcatc ctcgagactc ggaaaggact ggtag                   1185
<210>54
<211>1269
<212>DNA
<213>牛头犬蚁(Myrmecia forficata)
<400>54
agcgagctcg aatcggaagc gagtgcggcg gcgtctgcgc aagcggaagc gtcctcgtct     60
ggtcgctccg gcaaactgtc cgcgtctcag gcttccgcca gcgcgtccgc cagcgcgtca    120
gccggcagca gaggtggcag caaaggtggc tggggccagc tccgccgtgg tgatgttaag    180
agcgaggcga agagcgccgc cgcgatcgcg gtcgaaggag ctaaaatcgg caccggaatc    240
ggaaataccg cgtccgcatc cgcggaggcg ctctcacgag gactcggcat cggacaggcg    300
gccgcggagg cgcaagccgc agccgcaggt caggcagagg tcgccgcgaa atcgtgcgaa    360
cttgccgaca agaccaccgc caaagcggtc gccatggtcg aagcggcagc cgaggccgaa    420
atcgaggtgg ccaatcagga ggtcgcagcc gtcaaattat cgacttgggc cgctaaagca    480
gcaaggatag tcgaggaaga cagcgccgcc gtgagggcgg ctgccggcaa attgcttttg    540
gccgcgagag ctgccgccgc cgccgagaga cgcgccaacg aggaatccga ggcggccaac    600
gaacttgctc aagcgtcatc tgccgctgcc gccgaggccg aagccaaagc gaacgccggc    660
cgtgaggccg ctgccgctgc cttggctatc gccgaggccg ccgtcgccat cgaacaagaa    720
gccgtcattt tggctcgcaa ggcacaagat gcccgtttga atgctgaagc cgcagccgcc    780
gctgcgatga acgcccgtgt catcgcttcc gccgaatccg aggccagtga agatctggag    840
aatcgcgcta gtgtggcgcg tgccagtgcg gccggtgccg ctgaggcaaa ggctatcgcc    900
accgatgccg gcgccactgc cgagatcgcg gcctacagtt gggccaagaa gggcgaactg    960
atcaaccccg gcccgttgcc gaagatcatc agcgtcaacg ccgatctgtc caagagcgag   1020
gtcgaggcca tgaagatcac ccggggtcaa gtacaggaag tcaagaaaat cagcactcac   1080
aaaggtggct ggggatgggg aaaggaagga aggtcgaagg tatcttccaa cgctagtgcc   1140
agagctagtg ccagcgccaa tgcagccgcc ggtagcctcg gcagcaaatg gggaagacaa   1200
ctatccgcat catccgcgtc ggctgacgcc aacgccgaag ccgacagcca gttgctgaaa   1260
gtgtggtga                                                           1269
<210>55
<211>1326
<212>DNA
<213>牛头犬蚁(Myrmecia forficata)
<400>55
atgaagattc cagcgatact tgcgacgtcc ctcctcatct ggggtcttgt cggcgccagc     60
gagctcgaat cggaagcgag tgcggcggcg tctgcgcaag cggaagcgtc ctcgtctggt    120
cgctccggca aactgtccgc gtctcaggct tccgccagcg cgtccgccag cgcgtcagcc    180
ggcagcagag gtggcagcaa aggtggctgg ggccagctcc gccgtggtga tgttaagagc    240
gaggcgaaga gcgccgccgc gatcgcggtc gaaggagcta aaatcggcac cggaatcgga    300
aataccgcgt ccgcatccgc ggaggcgctc tcacgaggac tcggcatcgg acaggcggcc    360
gcggaggcgc aagccgcagc cgcaggtcag gcagaggtcg ccgcgaaatc gtgcgaactt    420
gccgacaaga ccaccgccaa agcggtcgcc atggtcgaag cggcagccga ggccgaaatc    480
gaggtggcca atcaggaggt cgcagccgtc aaattatcga cttgggccgc taaagcagca    540
aggatagtcg aggaagacag cgccgccgtg agggcggctg ccggcaaatt gcttttggcc    600
gcgagagctg ccgccgccgc cgagagacgc gccaacgagg aatccgaggc ggccaacgaa    660
cttgctcaag cgtcatctgc cgctgccgcc gaggccgaag ccaaagcgaa cgccggccgt    720
gaggccgctg ccgctgcctt ggctatcgcc gaggccgccg tcgccatcga acaagaagcc    780
gtcattttgg ctcgcaaggc acaagatgcc cgtttgaatg ctgaagccgc agccgccgct    840
gcgatgaacg cccgtgtcat cgcttccgcc gaatccgagg ccagtgaaga tctggagaat    900
cgcgctagtg tggcgcgtgc cagtgcggcc ggtgccgctg aggcaaaggc tatcgccacc    960
gatgccggcg ccactgccga gatcgcggcc tacagttggg ccaagaaggg cgaactgatc   1020
aaccccggcc cgttgccgaa gatcatcagc gtcaacgccg atctgtccaa gagcgaggtc   1080
gaggccatga agatcacccg gggtcaagta caggaagtca agaaaatcag cactcacaaa   1140
ggtggctggg gatggggaaa ggaaggaagg tcgaaggtat cttccaacgc tagtgccaga   1200
gctagtgcca gcgccaatgc agccgccggt agcctcggca gcaaatgggg aagacaacta   1260
tccgcatcat ccgcgtcggc tgacgccaac gccgaagccg acagccagtt gctgaaagtg   1320
tggtga                                                              1326
<210>56
<211>372
<212>PRT
<213>黄猄蚁(Oecophylla smaragdina)
<400>56
Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser Ala Ser Ala
1               5                   10                  15
Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val Gly Val Gly
            20                  25                  30
Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala Ser Thr Thr
        35                  40                  45
Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala Ala Leu Asn
    50                  55                  60
Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu Gln Leu Leu
65                  70                  75                  80
Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu Ala Asp Asp
                85                  90                  95
Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser Val Ala Ala
            100                 105                 110
Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu Asp Ala Ala
        115                 120                 125
Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val Ser Ala Gln
    130                 135                 140
Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile Gln Thr Ala
145                 150                 155                 160
Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys Gln Glu Ala
                165                 170                 175
Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu Ala Leu Ser
            180                 185                 190
Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala Gln Asn Ala
        195                 200                 205
Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala Glu Ala Arg
    210                 215                 220
Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu Thr Ala Ala
225                 230                 235                 240
Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala Gly Ser Val
                245                 250                 255
Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala Glu Val Asn
            260                 265                 270
Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn Gln Glu Ile
        275                 280                 285
Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly Val Ile Ser
    290                 295                 300
Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val Thr Ala Gly
305                 310                 315                 320
Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser Ser Ser Ser
                325                 330                 335
Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn Trp Gly Leu
            340                 345                 350
Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser Ser Ala Ser
        355                 360                 365
Ser Tyr Ser Ser
370
<210>57
<211>391
<212>PRT
<213>黄猄蚁(Oecophylla smaragdina)
<400>57
Met Lys Ile Pro Ala Ile Ile Ala Thr Thr Leu Leu Leu Trp Gly Phe
1               5                   10                  15
Ala Asp Ala Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser
            20                  25                  30
Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val
        35                  40                  45
Gly Val Gly Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala
    50                  55                  60
Ser Thr Thr Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala
65                  70                  75                  80
Ala Leu Asn Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu
                85                  90                  95
Gln Leu Leu Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu
            100                  105                  110
Ala Asp Asp Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser
        115                 120                 125
Val Ala Ala Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu
    130                  135                  140
Asp Ala Ala Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val
145                 150                 155                 160
Ser Ala Gln Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile
                165                 170                 175
Gln Thr Ala Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys
            180                 185                 190
Gln Glu Ala Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu
        195                 200                 205
Ala Leu Ser Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala
    210                 215                 220
Gln Asn Ala Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala
225                 230                 235                 240
Glu Ala Arg Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu
                245                 250                 255
Thr Ala Ala Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala
            260                 265                 270
Gly Ser Val Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala
        275                 280                 285
Glu Val Asn Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn
    290                 295                 300
Gln Glu Ile Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly
305                 310                 315                 320
Val Ile Ser Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val
                325                 330                 335
Thr Ala Gly Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser
            340                 345                 350
Ser Ser Ser Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn
        355                 360                 365
Trp Gly Leu Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser
    370                 375                 380
Ser Ala Ser Ser Tyr Ser Ser
385                 390
<210>58
<211>381
<212>PRT
<213>黄猄蚁(Oecophylla smaragdina)
<400>58
Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala Ser Ala Ser
1               5                   10                  15
Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala Ser Ile Gly
            20                  25                  30
Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu Ala Val Gly
        35                  40                  45
Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala Val Val Glu
    50                  55                  60
Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg Thr Leu Asn
65                  70                  75                  80
Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala Arg Ala Gln
                85                  90                  95
Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala Leu Ile Lys
            100                 105                 110
Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu Tyr Leu Ala
        115                 120                 125
Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Ala Ala
    130                 135                 140
Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys Val Ser Ser
145                 150                 155                 160
Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala Glu Ala Lys
                165                 170                 175
Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala
            180                 185                 190
Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala Gln Gln Ser
        195                 200                 205
Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys Ala Gln Ala
    210                 215                 220
Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile Ala Glu Ala
225                 230                 235                 240
Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val Cys Thr Ser
                245                 250                 255
Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ala Glu
            260                 265                 270
Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala Ala Glu Ala
        275                 280                 285
Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln Ala Trp Ala
    290                 295                 300
Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu Ala Glu Ala
305                 310                 315                 320
Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser Gly Ser Ser
                325                 330                 335
Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly Ala Ser Ser
            340                 345                 350
Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe Ser Glu Ala
        355                 360                 365
Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala
    370                 375                 380
<210>59
<211>400
<212>PRT
<213>黄猄蚁(Oecophylla smaragdina)
<400>59
Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Ala Trp Gly Leu
1               5                   10                  15
Ala Ser Gly Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala
            20                  25                  30
Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala
        35                  40                  45
Ser Ile Gly Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu
    50                  55                  60
Ala Val Gly Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala
65                  70                  75                  80
Val Val Glu Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg
                85                  90                  95
Thr Leu Asn Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala
            100                 105                 110
Arg Ala Gln Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala
        115                 120                 125
Leu Ile Lys Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu
    130                 135                 140
Tyr Leu Ala Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala
145                 150                 155                 160
Thr Ala Ala Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys
                165                 170                 175
Val Ser Ser Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala
            180                 185                 190
Glu Ala Lys Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala
        195                 200                 205
Val Leu Ala Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala
    210                 215                 220
Gln Gln Ser Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys
225                 230                 235                 240
Ala Gln Ala Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile
                245                 250                 255
Ala Glu Ala Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val
            260                 265                 270
Cys Thr Ser Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser
        275                 280                 285
Ala Ala Glu Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala
    290                 295                 300
Ala Glu Ala Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln
305                 310                 315                 320
Ala Trp Ala Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu
                325                 330                 335
Ala Glu Ala Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser
            340                 345                 350
Gly Ser Ser Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly
        355                 360                 365
Ala Ser Ser Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe
    370                 375                 380
Ser Glu Ala Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala
385                 390                 395                 400
<210>60
<211>376
<212>PRT
<213>黄猄蚁(Oecophylla smaragdina)
<400>60
Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala Ser Ala Ser
1                  5                  10                  15
Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser Lys Asn Val
            20                  25                  30
His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser
        35                  40                  45
Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp Glu Ile Asn
    50                  55                  60
Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser Leu Ala Leu
65                  70                  75                  80
Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala Leu Ala Ile
                85                  90                  95
Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val Arg Ala Ala
            100                 105                 110
Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr Val Arg Ala
        115                 120                 125
Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg Ala Ala Ala
    130                 135                 140
Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala Asp Ala Ala
145                 150                 155                 160
Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln Asp Ala Arg
                165                 170                 175
Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala Glu Asn Ala
            180                 185                 190
Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser Ile Ala Lys
        195                 200                 205
Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp Ala Ala Ala
    210                 215                 220
Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn Ala Val Ser
225                 230                 235                 240
Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala Ala Glu Glu
                245                 250                 255
Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln Leu Thr Ala
            260                 265                 270
Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala Ser Ala Ser
        275                 280                 285
Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala Ala Leu Ala
    290                 295                 300
Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly Leu Gly Asn
305                 310                 315                 320
Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser Ala Leu Ala
                325                 330                 335
Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr Lys Ile Gly
            340                 345                 350
Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gln
        355                 360                 365
Ser Ser Ser Gln Gly Leu Val Tyr
    370                 375
<210>61
<211>395
<212>PRT
<213>黄猄蚁(Oecophylla smaragdina)
<400>61
Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu
1               5                   10                  15
Ala Ser Gly Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala
            20                  25                  30
Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser
        35                  40                  45
Lys Asn Val His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile
    50                  55                  60
Asp Lys Ser Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp
65                  70                  75                  80
Glu Ile Asn Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser
                85                  90                  95
Leu Ala Leu Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala
            100                 105                 110
Leu Ala Ile Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val
        115                 120                 125
Arg Ala Ala Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr
    130                 135                 140
Val Arg Ala Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg
145                 150                 155                 160
Ala Ala Ala Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala
                165                 170                 175
Asp Ala Ala Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln
            180                 185                 190
Asp Ala Arg Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala
        195                 200                 205
Glu Asn Ala Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser
    210                 215                 220
Ile Ala Lys Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asn
225                 230                 235                 240
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn
                245                 250                 255
Ala Val Ser Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala
            260                 265                 270
Ala Glu Glu Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln
        275                 280                 285
Leu Thr Ala Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala
    290                 295                 300
Ser Ala Ser Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala
305                 310                 315                 320
Ala Leu Ala Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly
                325                 330                 335
Leu Gly Asn Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser
            340                 345                 350
Ala Leu Ala Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr
        355                 360                 365
Lys Ile Gly Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala
    370                 375                 380
Ser Ala Gln Ser Ser Ser Gln Gly Leu Val Tyr
385                 390                 395
<210>62
<211>424
<212>PRT
<213>黄猄蚁(Oecophylla smaragdina)
<400>62
Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser Ala Glu Ala
1               5                   10                  15
Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile Gly Ser Gly
            20                  25                  30
Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser
        35                  40                  45
Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn Val Gly Thr
    50                  55                  60
Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly
65                  70                  75                  80
Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly
                85                  90                  95
Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala Lys Ser Thr
            100                 105                 110
Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala Glu Val Asp
        115                 120                 125
Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala Glu Ala Ala
    130                 135                 140
Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu Arg Gly Ala
145                 150                 155                 160
Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys Ala Gln Glu
                165                 170                 175
Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala Gln Ala Thr
            180                 185                 190
Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala Ala Gln Glu
        195                 200                 205
Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu Asn Ile Glu
    210                 215                 220
Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr Arg Leu Arg
225                 230                 235                 240
Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala Ile Ala Ser
                245                 250                 255
Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala Asn Ala Ala
            260                 265                 270
Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val Ala Thr Glu
        275                 280                 285
Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser Glu Lys Gly
    290                 295                 300
Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser Val Thr Ala
305                 310                 315                 320
Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala Ala Ser Ala
                325                 330                 335
Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly Ala Gly Ala
            340                 345                 350
Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val Ala Gly Ala
        355                 360                 365
Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser Ala Gly Ala
    370                 375                 380
Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln Ser Lys Leu
385                 390                 395                 400
His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala
                405                 410                 415
Glu Ala Asn Ser Ser Ala Tyr Ala
            420
<210>63
<211>443
<212>PRT
<213>黄猄蚁(Oecophylla smaragdina)
<400>63
Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Phe Val Trp Gly Leu
1               5                   10                  15
Val Gly Ala Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser
            20                  25                  30
Ala Glu Ala Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile
        35                  40                  45
Gly Ser Gly Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala
    50                  55                  60
Ser Ala Ser Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn
65                  70                  75                  80
Val Gly Thr Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu
                85                  90                  95
Ser Arg Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala
            100                 105                 110
Ala Ala Gly Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala
        115                 120                 125
Lys Ser Thr Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala
    130                 135                 140
Glu Val Asp Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala
145                 150                 155                 160
Glu Ala Ala Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu
                165                 170                 175
Arg Gly Ala Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys
            180                 185                 190
Ala Gln Glu Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala
        195                 200                 205
Gln Ala Thr Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala
    210                 215                 220
Ala Gln Glu Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu
225                 230                 235                 240
Asn Ile Glu Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr
                245                 250                 255
Arg Leu Arg Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala
            260                 265                 270
Ile Ala Ser Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala
        275                 280                 285
Asn Ala Ala Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val
    290                 295                 300
Ala Thr Glu Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser
305                 310                 315                 320
Glu Lys Gly Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser
                325                 330                 335
Val Thr Ala Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala
            340                 345                 350
Ala Ser Ala Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly
        355                 360                 365
Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val
    370                 375                 380
Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser
385                 390                 395                 400
Ala Gly Ala Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln
                405                 410                 415
Ser Lys Leu His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser
            420                 425                 430
Ala Glu Ala Glu Ala Asn Ser Ser Ala Tyr Ala
        435                 440
<210>64
<211>1119
<213>黄猄蚁(Oecophylla smaragdina)
<400>64
agcaagtcgt acctcttagg ctcatccgcg tctgcttccg cttccgcttc cgcctcggca     60
tcagcgggag gaagcaccgg cggcgtcggc gtcggatctg taatatccgg tggcaacaac    120
atcatcagag gagcttcgac cacatccgtg acattggcag ccgccgcagc ggaggccaag    180
gcagctctga atgctggaaa agcgactgtc gaagagcaaa gggaagcgtt acagttgctc    240
accgcgtccg ctgaaaaaaa cgccgaggcg cgttccttgg ccgacgatgc ggccgttcta    300
gttcagggtg ccgctgaggc gcaatcggtc gccgccgcga agacggtcgc ggtcgagcaa    360
ggatccaact ctctggatgc agctgcagcc gaagcggaag ccgccgccgc cgcatccagg    420
gtatcggccc agcaggcact ccaggccgcg cagacctccg ccgccgctat tcaaaccgct    480
gccggtagcg ccctgacggc tctcaaattg gcacgcaaac aggaagcgga atccaataat    540
gccgccgaac aggcaaataa agcattggcc ttaagtcgcg cagccagcgc tgccactcaa    600
cgagccgtgg cagctcagaa cgcggctgcc gcatcagcgg cttcggctgg agccgcacaa    660
gctgaggcaa ggaacgccta cgccaaagcc aaagcagcga tagctgctct tacggccgcc    720
caaagaaatt acgccgcggc caaggctagc gcaagcgcgg gtagcgtggt ggccgaacaa    780
gatgctcaat ctagagcggc cgatgccgag gtgaacgccg ttgcccaagc cgctgcccga    840
gccagcgttc gcaatcagga gatcgttgaa atcggcgcgg aattcggcaa cgccagcggc    900
ggagtgatct cgaccggcac acgttcttcc ggaggcaagg gtgtctccgt taccgctgga    960
gctcaggcta gcgcgtccgc ttccgcgacc tcctcctcct cctcctcctc cggcatcaac   1020
aaaggacatc ccagatgggg gcacaattgg ggtttaggtt cttcggaagc gtcagcaaac   1080
gctgaagccg aaagcagcgc ttcctcttat tcatcttaa                          1119
<210>65
<211>1176
<212>DNA
<213>黄猄蚁(Oecophylla smaragdina)
<400>65
atgaagatcc cagcgataat cgcaacgacc ctccttctct ggggtttcgc cgacgccagc     60
aagtcgtacc tcttaggctc atccgcgtct gcttccgctt ccgcttccgc ctcggcatca    120
gcgggaggaa gcaccggcgg cgtcggcgtc ggatctgtaa tatccggtgg caacaacatc    180
atcagaggag cttcgaccac atccgtgaca ttggcagccg ccgcagcgga ggccaaggca    240
gctctgaatg ctggaaaagc gactgtcgaa gagcaaaggg aagcgttaca gttgctcacc    300
gcgtccgctg aaaaaaacgc cgaggcgcgt tccttggccg acgatgcggc cgttctagtt    360
cagggtgccg ctgaggcgca atcggtcgcc gccgcgaaga cggtcgcggt cgagcaagga    420
tccaactctc tggatgcagc tgcagccgaa gcggaagccg ccgccgccgc atccagggta    480
tcggcccagc aggcactcca ggccgcgcag acctccgccg ccgctattca aaccgctgcc    540
ggtagcgccc tgacggctct caaattggca cgcaaacagg aagcggaatc caataatgcc    600
gccgaacagg caaataaagc attggcctta agtcgcgcag ccagcgctgc cactcaacga    660
gccgtggcag ctcagaacgc ggctgccgca tcagcggctt cggctggagc cgcacaagct    720
gaggcaagga acgcctacgc caaagccaaa gcagcgatag ctgctcttac ggccgcccaa    780
agaaattacg ccgcggccaa ggctagcgca agcgcgggta gcgtggtggc cgaacaagat    840
gctcaatcta gagcggccga tgccgaggtg aacgccgttg cccaagccgc tgcccgagcc    900
agcgttcgca atcaggagat cgttgaaatc ggcgcggaat tcggcaacgc cagcggcgga    960
gtgatctcga ccggcacacg ttcttccgga ggcaagggtg tctccgttac cgctggagct   1020
caggctagcg cgtccgcttc cgcgacctcc tcctcctcct cctcctccgg catcaacaaa  1080
ggacatccca gatgggggca caattggggt ttaggttctt cggaagcgtc agcaaacgct  1140
gaagccgaaa gcagcgcttc ctcttattca tcttaa                            1176
<210>66
<211>1146
<212>DNA
<213>黄猄蚁(Oecophylla smaragdina)
<400>66
ggagtcatag gtcccgacac gtcctcatcg tcccaggcat cggcatcggc atcggcgtca     60
gcatcggcgt cggcatcatc gtcggcatcg atcggttaca acgaactcca taaatcgatc    120
aatgcgcccg ccttggcggt cggcgtcaag aacggcggag tggatgtcgc caagggcgcg    180
gccgttgtcg aatcagcgat atccgacgta tcgactctaa ccgatgatcg tacgttgaac    240
ggtctcgcta tcatcgggaa tagcgccgag agtctggcaa gagcacaggc ttcctcgagc    300
gccagcgccg gcgcaaaagc caatgctctc atcaaacaat cgatagcggc tatagagatc    360
accgaaaagg cagagtacct tgcgtcgatc gtcgccacca aggcagcgaa ggccgccgag    420
gccacagcgg ccgcgaccgc tcgcgccact gccgtcgccg aggctgccaa ggtttccagc    480
gagcaattcg cggccgaggc acgcgcggcc gccgacgccg aagccaaggc caacgccgct    540
tccatcatcg ccaacaaagc gaacgccgtc ctcgcggagg cagccaccgg acttagcgcc    600
agcgctggca aagcccaaca atcggcgacc agggcgttgc aagccgcacg agctgccgct    660
aaggctcaag ccgaacttac ccagaaagcc gctcaaatct tagtcctcat tgctgaagcc    720
aaagccgccg tgagccgagc aagcgccgat caatccgtct gtacgtccca ggcacaagcc    780
gccagtcaga ttcaatcgag agcctccgcg gccgaatccg cggcatcggc tcaatcggaa    840
gccaacacca ttgcggccga ggcggtcgct agagctgacg ccgaggcggc cagtcaagct    900
caagcgtggg ccgaatcctt caaacgcgaa ctctcgagtg tcgttttgga ggccgaggcc    960
aatgcctcgg ctagtgcctc ggctggtgcc ctggccagtg gtagcagcag ctcgggcgcg   1020
agttccagcg cggatgccag cgccggagcg agcagctatg gatccttggg cggatatcga   1080
cacggcggaa gcttcagcga ggcatcggca gccgcgtcag cggccagtcg cgccgaggct   1140
gcgtaa                                                              1146
<210>67
<211>1203
<212>DNA
<213>黄猄蚁(Oecophylla smaragdina)
<400>67
atgaagattc cagcgatatt cgtgacgtct ctgctcgcct ggggactcgc cagcggcgga     60
gtcataggtc ccgacacgtc ctcatcgtcc caggcatcgg catcggcatc ggcgtcagca    120
tcggcgtcgg catcatcgtc ggcatcgatc ggttacaacg aactccataa atcgatcaat    180
gcgcccgcct tggcggtcgg cgtcaagaac ggcggagtgg atgtcgccaa gggcgcggcc    240
gttgtcgaat cagcgatatc cgacgtatcg actctaaccg atgatcgtac gttgaacggt    300
ctcgctatca tcgggaatag cgccgagagt ctggcaagag cacaggcttc ctcgagcgcc    360
agcgccggcg caaaagccaa tgctctcatc aaacaatcga tagcggctat agagatcacc    420
gaaaaggcag agtaccttgc gtcgatcgtc gccaccaagg cagcgaaggc cgccgaggcc    480
acagcggccg cgaccgctcg cgccactgcc gtcgccgagg ctgccaaggt ttccagcgag    540
caattcgcgg ccgaggcacg cgcggccgcc gacgccgaag ccaaggccaa cgccgcttcc    600
atcatcgcca acaaagcgaa cgccgtcctc gcggaggcag ccaccggact tagcgccagc    660
gctggcaaag cccaacaatc ggcgaccagg gcgttgcaag ccgcacgagc tgccgctaag    720
gctcaagccg aacttaccca gaaagccgct caaatcttag tcctcattgc tgaagccaaa    780
gccgccgtga gccgagcaag cgccgatcaa tccgtctgta cgtcccaggc acaagccgcc    840
agtcagattc aatcgagagc ctccgcggcc gaatccgcgg catcggctca atcggaagcc    900
aacaccattg cggccgaggc ggtcgctaga gctgacgccg aggcggccag tcaagctcaa    960
gcgtgggccg aatccttcaa acgcgaactc tcgagtgtcg ttttggaggc cgaggccaat   1020
gcctcggcta gtgcctcggc tggtgccctg gccagtggta gcagcagctc gggcgcgagt   1080
tccagcgcgg atgccagcgc cggagcgagc agctatggat ccttgggcgg atatcgacac   l140
ggcggaagct tcagcgaggc atcggcagcc gcgtcagcgg ccagtcgcgc cgaggctgcg   1200
taa                                                                 1203
<210>68
<211>1131
<212>DNA
<213>黄猄蚁(Oecophylla smaragdina)
<400>68
ggtgtcccta aagagttggg aacttccatt tcttccgcgt ccgcatccgc atccgcatcc     60
gcatccgcga ccgcgtcctc cagtagcaag aatgttcact tattaccatt gaaaagcgag    120
catggcatcg taattgacaa gtcaaaattc aacatcagaa aggtagtgtt gagcgcaatc    180
gatgagatca acggcgcgcc caacatcggt ctgggattga aacaggtcag tttggcgctc    240
gcaaaagccc aggctagtgc tcaatcgagc gccgaggcat tggcaatcat caagaaaatc    300
gtcgcgctcc tcatctcggc ctacgtcaga gcagccgagg ccgcggctcg agcatccgcc    360
gaagctttag ctaccgttag ggctgcggaa caagcgcaaa aaattgctga agcgaagggt    420
agagcggctg ctgaggcgct ctccgagtta gtcgaggcgt cccagaaggc cgatgcggcg    480
gccgcgggaa cgacggacgc gatcgaacgc acctaccagg atgccagagc ggccacttcc    540
gcacagacca aggccagcgg cgaagccgag aatgctaatc gcaatgctgc cgccaccctc    600
gcggcggtct tgagcatcgc taaggccgcc tccggtcaag gaggcactcg agccgctgtc    660
gatgcagctg ctgccgctgc cgccgcagcc gctctgcatg ctaaagctaa cgcggtttcg    720
caagctacca gcaaagcagc cgctgaagct agagtcgcgg ctgaggaggc agcatccgcc    780
caggcatccg cctcagcaag cgcacagctg accgcacaat tagaggagaa agtcagcgcc    840
gatcaacaag cagcctccgc cagtactgat acctccgctg ctatagccga ggctgaagct    900
gccgcgttag cgtccaccgt caacgcgatc aacgacggag tggtcatcgg attaggaaat    960
accgccagtt cttctgccca agcttccgca caggccagtg ctctcgctcg cgcaaaaaat   1020
gcgcgcccta aaataaaggg ctggtacaaa atcggaggcg cgacttccgc ttctgcaagc   1080
gcatcggcca gcgcttccgc ccagtcatcc tcgcaaggac tggtatacta g            1131
<210>69
<211>1188
<212>DNA
<213>黄猄蚁(Oecophylla smaragdina)
<400>69
atgaagattc cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggggt     60
gtccctaaag agttgggaac ttccatttct tccgcgtccg catccgcatc cgcatccgca    120
tccgcgaccg cgtcctccag tagcaagaat gttcacttat taccattgaa aagcgagcat    180
ggcatcgtaa ttgacaagtc aaaattcaac atcagaaagg tagtgttgag cgcaatcgat    240
gagatcaacg gcgcgcccaa catcggtctg ggattgaaac aggtcagttt ggcgctcgca    300
aaagcccagg ctagtgctca atcgagcgcc gaggcattgg caatcatcaa gaaaatcgtc    360
gcgctcctca tctcggccta cgtcagagca gccgaggccg cggctcgagc atccgccgaa    420
gctttagcta ccgttagggc tgcggaacaa gcgcaaaaaa ttgctgaagc gaagggtaga    480
gcggctgctg aggcgctctc cgagttagtc gaggcgtccc agaaggccga tgcggcggcc    540
gcgggaacga cggacgcgat cgaacgcacc taccaggatg ccagagcggc cacttccgca    600
cagaccaagg ccagcggcga agccgagaat gctaatcgca atgctgccgc caccctcgcg    660
gcggtcttga gcatcgctaa ggccgcctcc ggtcaaggag gcactcgagc cgctgtcgat    720
gcagctgctg ccgctgccgc cgcagccgct ctgcatgcta aagctaacgc ggtttcgcaa    780
gctaccagca aagcagccgc tgaagctaga gtcgcggctg aggaggcagc atccgcccag    840
gcatccgcct cagcaagcgc acagctgacc gcacaattag aggagaaagt cagcgccgat    900
caacaagcag cctccgccag tactgatacc tccgctgcta tagccgaggc tgaagctgcc    960
gcgttagcgt ccaccgtcaa cgcgatcaac gacggagtgg tcatcggatt aggaaatacc   1020
gccagttctt ctgcccaagc ttccgcacag gccagtgctc tcgctcgcgc aaaaaatgcg   1080
cgccctaaaa taaagggctg gtacaaaatc ggaggcgcga cttccgcttc tgcaagcgca   1140
tcggccagcg cttccgccca gtcatcctcg caaggactgg tatactag                1188
<210>70
<211>1275
<212>DNA
<213>黄猄蚁(Oecophylla smaragdina)
<400>70
agcgaactcg tcggatcgga cgcgagcgcg acggcatctg ctgaagcgtc agcatcgtca     60
tccgcatacg gtagcaagta tggtattggt agtggtgctg tctccggtgc atcagccagc    120
gcctctgcca gcgcgtctgc tagcgcatca gccagcagtg ctcccgcgat cgaaggagta    180
aacgttggca ccggagtcag taacaccgct tccgcgtccg cagaagctct ctcccgtgga    240
ctcggcatcg gacaagcggc tgccgaagcg caagccgctg ccgctggcca agcggcgatc    300
gctgcgaaat cgtgcgcgct agcggccaag agcaccgctc aagcggttgc cctggttgag    360
aaagtggccc gcgccgaggt agatctggcc gaaagcgcga gaaaggctac aagattatcg    420
gcagaagcag ccaaggcagc ggcggaagtc gagaaggacc tcgtcggtct gagaggggct    480
gccggtaaac tgaatctggc tgcgagagcc ggttctaaag cccaagaacg cgccaacgaa    540
gactctatag aggctaacga acttgcccaa gcaacggccg ccgccggtgc cgaggctgaa    600
gccaaggcga atgccgccca ggaggcaggc gcctccgctt tggccatcgc ccaagccgcc    660
cttaacatcg agcaagagac tgttaaattg acccgccagg cccagaatac tcgtctcaga    720
tctgaaaata ttctcgccgc ggccagcaat gcccgcgcca tcgcttccgc tgaggccgag    780
gccagtagtg atttgaataa tcgtgcgaat gcagcgcgtt ccaatgcccg agctgctgcc    840
gagaccagag ccgtagctac cgaagccgct tctaccgccg agatcgcagc ttatagttca    900
tccgagaaag gcgagatcac caatcccggt cctctgccca agatcgtcag tgttaccgca    960
ggtctgaccc agaacgaaat agcgggatca ggagcggccg ctagtgctag tgccagtgct   1020
cttgccagtg ccagtgccgg tgccggtgcc ggtgcaggtg caggagccgg tgcaagtgca   1080
ggagccggtg cagttgcagg tgcaggagcc ggtgcaggag ccggtgctag tgccggagcg   1140
agtgccggag cgaatgccgg tgccggtgcc agcagtttac tcttgccgca gagtaaactc   1200
catccaatct ccaggtcttc cgcctctgcc tccgcttccg ccgaggccga agctaacagt   1260
tcggcgtatg cgtaa                                                    1275
<210>71
<211>1332
<212>DNA
<213>黄猄蚁(Oecophylla smaragdina)
<400>71
atgaagattc cagcgatact tgcgacgtcc cttttcgtct ggggtcttgt cggcgccagc     60
gaactcgtcg gatcggacgc gagcgcgacg gcatctgctg aagcgtcagc atcgtcatcc    120
gcatacggta gcaagtatgg tattggtagt ggtgctgtct ccggtgcatc agccagcgcc    180
tctgccagcg cgtctgctag cgcatcagcc agcagtgctc ccgcgatcga aggagtaaac    240
gttggcaccg gagtcagtaa caccgcttcc gcgtccgcag aagctctctc ccgtggactc    300
ggcatcggac aagcggctgc cgaagcgcaa gccgctgccg ctggccaagc ggcgatcgct    360
gcgaaatcgt gcgcgctagc ggccaagagc accgctcaag cggttgccct ggttgagaaa    420
gtggcccgcg ccgaggtaga tctggccgaa agcgcgagaa aggctacaag attatcggca    480
gaagcagcca aggcagcggc ggaagtcgag aaggacctcg tcggtctgag aggggctgcc    540
ggtaaactga atctggctgc gagagccggt tctaaagccc aagaacgcgc caacgaagac    600
tctatagagg ctaacgaact tgcccaagca acggccgccg ccggtgccga ggctgaagcc    660
aaggcgaatg ccgcccagga ggcaggcgcc tccgctttgg ccatcgccca agccgccctt    720
aacatcgagc aagagactgt taaattgacc cgccaggccc agaatactcg tctcagatct    780
gaaaatattc tcgccgcggc cagcaatgcc cgcgccatcg cttccgctga ggccgaggcc    840
agtagtgatt tgaataatcg tgcgaatgca gcgcgttcca atgcccgagc tgctgccgag    900
accagagccg tagctaccga agccgcttct accgccgaga tcgcagctta tagttcatcc    960
gagaaaggcg agatcaccaa tcccggtcct ctgcccaaga tcgtcagtgt taccgcaggt   1020
ctgacccaga acgaaatagc gggatcagga gcggccgcta gtgctagtgc cagtgctctt   1080
gccagtgcca gtgccggtgc cggtgccggt gcaggtgcag gagccggtgc aagtgcagga   1140
gccggtgcag ttgcaggtgc aggagccggt gcaggagccg gtgctagtgc cggagcgagt   1200
gccggagcga atgccggtgc cggtgccagc agtttactct tgccgcagag taaactccat   1260
ccaatctcca ggtcttccgc ctctgcctcc gcttccgccg aggccgaagc taacagttcg   1320
gcgtatgcgt aa                                                       1332
<210>72
<211>562
<212>PRT
<213>玛草蛉(Mallada signata)
<400>72
Ala Val Leu Ile Ser Gly Ser Ala Ala Gly Ala Ser Ser His Asn Ala
1               5                   10                  15
Ala Gly Ala Ala Ala Ala Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala
            20                  25                  30
Ala Gly Leu Gly Ala Ala Ser Gly Ala Ala Arg Arg Asn Val Ala Val
        35                  40                  45
Gly Ala Asn Gly Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg
    50                  55                  60
Arg Ala Gly Ala Ile Gly Leu Asn Gly Ala Ala Gly Ala Asn Val Ala
65                  70                  75                  80
Val Ala Gly Gly Lys Lys Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala
                85                  90                  95
Gly Ala Ser Leu Val Ser Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly
            100                 105                 110
Leu Asn Gly Ala Ala Gly Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys
        115                 120                 125
Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala Asn Val Gly Ala
    130                 135                 140
Ala Ala Ala Lys Lys Asn Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser
145                 150                 155                 160
Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu
                165                 170                 175
Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser
            180                 185                 190
Gly Ala Val Gly Leu Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala
        195                 200                 205
Ala Ala Lys Lys Ser Gly Ala Val Ala Ala Asn Ser Ala Ala Ser Ala
    210                 215                 220
Asn Ala Ala Ala Ala Ala Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn
225                 230                 235                 240
Ala Ala Ala Ser Glu Ser Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala
                245                 250                 255
Ala Val Ala Glu Asn Ala Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu
            260                 265                 270
Arg Lys Asn Ala Leu Ala Ile Ala Ser Asp Ala Ala Ala Val Arg Ala
        275                 280                 285
Asp Ala Ala Ala Ala Ala Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala
    290                 295                 300
Ala Ser Arg Gly Ser Asp Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr
305                 310                 315                 320
Leu Ala Ser Asp Ala Ala Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala
                325                 330                 335
Ser Asp Ala Ala Thr Asp Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn
           340                 345                 350
Ala Ala Thr Ala Arg Ala Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala
        355                 360                 365
Thr Asp Ala Asp Asn Ala Ala Ser Lys Ala Ser Asp Val Ser Ala Ile
    370                 375                 380
Glu Ala Asp Asn Ala Ala Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr
385                 390                 395                 400
Asn Arg Ala Ala Glu Ala Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala
                405                 410                 415
Ala Ala Asn Ala Ala Asp Ala Ala Ala Gln Cys Asn Asn Lys Val Ala
            420                 425                 430
Arg Val Ser Asp Ala Leu Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly
        435                 440                 445
Ser Asp Ala Ala Ala Glu Ala Gln Asp Ala Val Ala Arg Ala Ser Asp
    450                 455                 460
Ala Ala Ala Ala Gln Ala Asp Gly Val Ala Ile Ala Val Asn Gly Ala
465                 470                 475                 480
Thr Ala Arg Asp Ser Ala Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala
                485                 490                 495
Gln Ala Lys Ala Ala Gly Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg
            500                 505                 510
Ala Gly Ala Ala Arg Gly Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala
        515                 520                 525
Gly Gly Leu Ala Ala Gly Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala
    530                 535                 540
Ser Gly Leu Ala Arg Gly Ala Ala Ala Glu Val Cys Ala Ala Arg Ile
545                 550                 555                 560
Ala Leu
<210>73
<211>588
<212>PRT
<213>玛草蛉(Mallada signata)
<400>73
Met Ala Ala Ser Asn Lys Ile Ile Phe Ser Phe Leu Ala Ile Val Leu
1               5                   10                  15
Leu Gln Leu Ala Thr His Cys Ser Ser Thr Ala Val Leu Ile Ser Gly
            20                  25                  30
Ser Ala Ala Gly Ala Ser Ser His Asn Ala Ala Gly Ala Ala Ala Ala
        35                  40                  45
Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala Ala Gly Leu Gly Ala Ala
    50                  55                  60
Ser Gly Ala Ala Arg Arg Asn Val Ala Val Gly Ala Asn Gly Ala Ala
65                  70                  75                  80
Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg Arg Ala Gly Ala Ile Gly
                85                  90                  95
Leu Asn Gly Ala Ala Gly Ala Asn Val Ala Val Ala Gly Gly Lys Lys
            100                 105                 110
Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala Gly Ala Ser Leu Val Ser
        115                 120                 125
Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly Leu Asn Gly Ala Ala Gly
    130                 135                 140
Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys Gly Gly Ala Ile Gly Leu
145                 150                 155                 160
Asn Ala Gly Ala Ser Ala Asn Val Gly Ala Ala Ala Ala Lys Lys Asn
                165                 170                 175
Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala
            180                 185                 190
Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala
        195                 200                 205
Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly Ala Val Gly Leu Asn
    210                 215                 220
Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly
225                 230                 235                 240
Ala Val Ala Ala Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala Ala
                245                 250                 255
Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn Ala Ala Ala Ser Glu Ser
            260                 265                 270
Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala Ala Val Ala Glu Asn Ala
        275                 280                 285
Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu Arg Lys Asn Ala Leu Ala
    290                 295                 300
Ile Ala Ser Asp Ala Ala Ala Val Arg Ala Asp Ala Ala Ala Ala Ala
305                 310                 315                 320
Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala Ala Ser Arg Gly Ser Asp
                325                 330                 335
Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr Leu Ala Ser Asp Ala Ala
            340                 345                 350
Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala Ser Asp Ala Ala Thr Asp
        355                 360                 365
Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn Ala Ala Thr Ala Arg Ala
    370                 375                 380
Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala Thr Asp Ala Asp Asn Ala
385                 390                 395                 400
Ala Ser Lys Ala Ser Asp Val Ser Ala Ile Glu Ala Asp Asn Ala Ala
                405                 410                 415
Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr Asn Arg Ala Ala Glu Ala
            420                 425                 430
Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala Ala Ala Asn Ala Ala Asp
        435                 440                 445
Ala Ala Ala Gln Cys Asn Asn Lys Val Ala Arg Val Ser Asp Ala Leu
    450                 455                 460
Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly Ser Asp Ala Ala Ala Glu
465                 470                 475                 480
Ala Gln Asp Ala Val Ala Arg Ala Ser Asp Ala Ala Ala Ala Gln Ala
                485                 490                 495
Asp Gly Val Ala Ile Ala Val Asn Gly Ala Thr Ala Arg Asp Ser Ala
            500                 505                 510
Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala Gln Ala Lys Ala Ala Gly
        515                 520                 525
Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg Ala Gly Ala Ala Arg Gly
    530                 535                 540
Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala Gly Gly Leu Ala Ala Gly
545                 550                 555                 560
Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala Ser Gly Leu Ala Arg Gly
                565                 570                 575
Ala Ala Ala Glu Val Cys Ala Ala Arg Ile Ala Leu
580                 585
<210>74
<211>1689
<212>DNA
<213>玛草蛉(Mallada signata)
<400>74
gctgtattga tttctggttc ggctgctggt gcttcctcac acaatgctgc tggtgcagct    60
gcagcagcca gagctgcctt aggcgcttct ggggctgcag gtttaggtgc tgcatctggt   120
gctgcaagaa gaaacgtagc agttggtgct aacggtgccg ccgccgctag tgctgcagct   180
gcagctgcca gacgagctgg cgctattggc ctaaatggag cagctggagc taatgtagct   240
gtcgctggtg gcaaaaaagg aggtgctgct ggattaaatg ctggcgctgg tgcttcttta   300
gtatctgcag ctgcaagacg aaatggagcc cttggactta acggtgcagc tggagcaaat   360
ctcgcagcag ctggtggcaa aaaaggaggt gctattggat taaacgctgg agcatcagcc   420
aatgttggtg ccgctgctgc caagaaaaat ggagccatag gacttaactc agctgcttca   480
gctaatgctg ccgctgccgc tgctaaaaaa ggtggagcca ttggattgaa tgctggagct   540
tcagcaaatg ctgctgctgc cgctgccaag aagagtggag ctgttggatt aaatgctgga   600
gcttctgcta acgctgctgc tgctgctgcc aagaaaagtg gagctgttgc tgccaattcc   660
gctgcttcag caaatgcagc tgctgctgca caaaagaaag ccgctgctga tgccgcaaat   720
gctgctgctt ctgaaagtgc tgctgctgct gcagccaaga aagccgccgc tgttgctgaa   780
aatgcagctg ccaccgccaa tgccgcttca gctttacgta aaaatgcatt agccattgcc   840
agtgatgcag cagctgtccg tgctgatgcc gctgccgccg ccgctgacga tgctgctaaa   900
gctaacaacg ctgcttcccg tggaagtgat ggtttaactg cccgcgccaa tgccgccact   960
ttagccagtg atgctgcccg tagagctagc aatgcagcaa cagctgccag cgatgctgcc  1020
actgaccgat tgaacgccgc caccgctgct agcaacgctg ccactgctcg tgcaaatgcc  1080
gccacacgtg ccgatgatgc cgccactgat gccgacaatg ctgcttcaaa ggccagtgat  1140
gtatcagcta ttgaagccga caacgctgca cgagctgctg atgctgatgc tatcgctacc  1200
aaccgtgccg ctgaagcaag cgatgctgct gctattgccg ctgatgccgc tgccaatgct  1260
gctgatgccg ctgcccaatg taataacaaa gttgcccgag taagtgatgc cttagctctc  1320
gccgctaatg ctgctgcccg aggatctgat gccgccgctg aagctcaaga tgctgttgcc  1380
agagcaagtg acgctgccgc tgcccaagct gatggtgttg ccattgccgt aaatggagct  1440
actgcgagag actcagcaat tgaagccgct gctactgctg gagctgccca agctaaagcc  1500
gctggacgtg ctggagctgc tgcagctggt ttaagagctg gtgccgctag aggtgctgcc  1560
gctggtagtg cccgcggtct agctggagga ttagctgcag gttccaatgc tggaatcgcg  1620
gctggtgcag cttctggatt agcaagaggc gcagctgctg aagtttgcgc agctagaata  1680
gcattgtaa                                                          1689
<210>75
<211>1767
<212>DNA
<213>玛草蛉(Mallada signata)
<400>75
atggcagcgt cgaacaaaat catcttcagc tttttagcta ttgttctatt acaacttgcc     60
acacactgtt catcaacagc tgtattgatt tctggttcgg ctgctggtgc ttcctcacac    120
aatgctgctg gtgcagctgc agcagccaga gctgccttag gcgcttctgg ggctgcaggt    180
ttaggtgctg catctggtgc tgcaagaaga aacgtagcag ttggtgctaa cggtgccgcc    240
gccgctagtg ctgcagctgc agctgccaga cgagctggcg ctattggcct aaatggagca    300
gctggagcta atgtagctgt cgctggtggc aaaaaaggag gtgctgctgg attaaatgct    360
ggcgctggtg cttctttagt atctgcagct gcaagacgaa atggagccct tggacttaac    420
ggtgcagctg gagcaaatct cgcagcagct ggtggcaaaa aaggaggtgc tattggatta    480
aacgctggag catcagccaa tgttggtgcc gctgctgcca agaaaaatgg agccatagga    540
cttaactcag ctgcttcagc taatgctgcc gctgccgctg ctaaaaaagg tggagccatt    600
ggattgaatg ctggagcttc agcaaatgct gctgctgccg ctgccaagaa gagtggagct    660
gttggattaa atgctggagc ttctgctaac gctgctgctg ctgctgccaa gaaaagtgga    720
gctgttgctg ccaattccgc tgcttcagca aatgcagctg ctgctgcaca aaagaaagcc    780
gctgctgatg ccgcaaatgc tgctgcttct gaaagtgctg ctgctgctgc agccaagaaa    840
gccgccgctg ttgctgaaaa tgcagctgcc accgccaatg ccgcttcagc tttacgtaaa    900
aatgcattag ccattgccag tgatgcagca gctgtccgtg ctgatgccgc tgccgccgcc    960
gctgacgatg ctgctaaagc taacaacgct gcttcccgtg gaagtgatgg tttaactgcc   1020
cgcgccaatg ccgccacttt agccagtgat gctgcccgta gagctagcaa tgcagcaaca   1080
gctgccagcg atgctgccac tgaccgattg aacgccgcca ccgctgctag caacgctgcc   1140
actgctcgtg caaatgccgc cacacgtgcc gatgatgccg ccactgatgc cgacaatgct   1200
gcttcaaagg ccagtgatgt atcagctatt gaagccgaca acgctgcacg agctgctgat   1260
gctgatgcta tcgctaccaa ccgtgccgct gaagcaagcg atgctgctgc tattgccgct   1320
gatgccgctg ccaatgctgc tgatgccgct gcccaatgta ataacaaagt tgcccgagta   1380
agtgatgcct tagctctcgc cgctaatgct gctgcccgag gatctgatgc cgccgctgaa   1440
gctcaagatg ctgttgccag agcaagtgac gctgccgctg cccaagctga tggtgttgcc   1500
attgccgtaa atggagctac tgcgagagac tcagcaattg aagccgctgc tactgctgga   1560
gctgcccaag ctaaagccgc tggacgtgct ggagctgctg cagctggttt aagagctggt   1620
gccgctagag gtgctgccgc tggtagtgcc cgcggtctag ctggaggatt agctgcaggt   1680
tccaatgctg gaatcgcggc tggtgcagct tctggattag caagaggcgc agctgctgaa   1740
gtttgcgcag ctagaatagc attgtaa                                       1767
<210>76
<211>975
<212>DNA
<213>人工序列
<220>
<223>为植物表达而进行优化的蜜蜂丝蛋白(Xenospira4)开放读码框(在亚克隆到pET14b和pVEC8之前)
<400>76
atggctagag aagaggttga gactagggat aagactaaga cttctactgt ggtgaagtct     60
gagaaggttg aagttgtggc tccagctaag gatgagctta agttgacttc tgagccaatt    120
ttcggaagaa gagtgggaac tggagcttct gaagtggctt cttctagtgg agaggctatt    180
gctatttctc ttggagctgg acaatcagca gcagagtctc aagctcttgc tgcttctcag    240
tctaagactg ctgctaacgc tgctattggt gcttctgagc ttactaacaa ggtggcagct    300
cttgttgctg gtgctactgg tgctcaagct agagctactg ctgcttcttc ttctgctctt    360
aaggcttctc ttgctactga agaggctgct gaagaagctg aagctgctgt tgcagatgct    420
aaagcagctg ctgagaaggc tgagtctctt gctaagaacc ttgcttctgc tagtgctaga    480
gctgctcttt cttctgagag ggctaatgag cttgctcagg ctgaaagtgc tgcagctgct    540
gaagctcaag ctaagaccgc tgctgctgcc aaagcagctg agattgctct taaggtggca    600
gagattgctg taaaagctga ggcagatgct gccgccgcag ccgtggcagc tgcaaaagct    660
agagctgtgg ctgatgcagc agccgccagg gctgctgctg ttaacgctat tgctaaggct    720
gaagaagagg cttcagctca agctgagaac gcagctggtg ttcttcaagc agctgcaagt    780
gctgctgctg agtcaagagc agcagcagcc gctgccgcag ctacttctga agcagcagct    840
gaagcaggac cacttgctgg tgaaatgaag ccaccacatt ggaagtggga gaggattcca    900
gtgaagaaag aagagtggaa aacttctaca aaagaggaat ggaaaactac taacgaagag    960
tgggaggtga agtga                                                     975
<210>77
<211>324
<212>PRT
<213>人工序列
<220>
<223>为植物表达而进行优化的开放读码框编码的蜜蜂丝蛋白(Xenospira4)(无翻译融合)
<400>77
Met Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr
1               5                   10                  15
Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu
            20                  25                  30
Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly
       35                  40                  45
Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu
     50                  55                  60
Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln
65                  70                  75                  80
Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn
                85                  90                  95
Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala
            100                 105                 110
Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu
        115                 120                 125
Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala
    130                 135                 140
Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg
145                 150                 155                 160
Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser
               165                 170                 175
Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala
            180                 185                 190
Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala
        195                 200                 205
Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala
    210                 215                 220
Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala
225                 230                 235                 240
Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln
                245                 250                 255
Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala
            260                 265                 270
Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu
        275                 280                 285
Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu
    290                 295                 300
Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu
305                 310                 315                 320
Trp Glu Val Lys

Claims (45)

1、一种基本上纯化的和/或重组的丝多肽,其中至少该丝多肽的一部分具有卷曲螺旋结构。
2、根据权利要求1所述的多肽,其中具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg,并且其中至少25%的a和d位氨基酸是丙氨酸残基。
3、根据权利要求1所述的多肽,其中具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg,并且至少25%的a、d和e位氨基酸是丙氨酸残基。
4、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列:
i)SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:56以及SEQ ID NO:57所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:56以及SEQ ID NO:57中任何一条或多条具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
5、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列:
i)SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:58以及SEQ ID NO:59所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:24、SEQ ID NO:25、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:58以及SEQ ID NO:59中任何一条或多条具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
6、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列:
i)SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:60以及SEQ ID NO:61所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:60以及SEQ ID NO:61中任何一条或多条具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
7、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列:
i)SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:46、SEQ ID NO:47、SEQ ID NO:62以及SEQ ID NO:63所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:46、SEQ ID NO:47、SEQ ID NO:62以及SEQ ID NO:63中任何一条或多条具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
8、根据权利要求1到3中任何一项所述的多肽,其包括选自下述的序列:
i)SEQ ID NO:72或SEQ ID NO:73所提供的氨基酸序列;
ii)与SEQ ID NO:72和/或SEQ ID NO:73具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
9、一种基本上纯化的和/或重组的丝多肽,其包括选自下述的序列:
i)SEQ ID NO:9、SEQ ID NO:10以及SEQ ID NO:30所提供的任何一条氨基酸序列;
ii)与SEQ ID NO:9、SEQ ID NO:10以及SEQ ID NO:30具有至少30%同源性的氨基酸序列;以及
iii)i)或ii)的生物活性片段。
10、根据权利要求1到9中任何一项所述的多肽,其可从膜翅目昆虫或脉翅目昆虫的一个物种中纯化获得。
11、根据权利要求10所述的多肽,其中所述的膜翅目昆虫的物种为意大利蜂Apis mellifera、黄猄蚁Oecophylla smaragdina、牛头犬蚁Myrmecia foricata或授粉熊蜂Bombus terrestris。
12、根据权利要求10所述的多肽,其中所述的脉翅目昆虫的物种为玛草蛉Mallada signata。
13、根据权利要求1到12中任何一项所述的多肽,其与至少一种其他多肽融合。
14、一种编码丝多肽的分离的和/或外源多核苷酸,其中至少丝多肽的一部分具有卷曲螺旋结构。
15、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列:
i)SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:31、SEQ ID NO:32、SEQ IDNO:48、SEQ ID NO:49、SEQ ID NO:64以及SEQ ID NO:65所提供的任何一条核苷酸序列;
ii)编码如权利要求1到4或10到13中任何一项所述的多肽的核苷酸序列,
iii)与SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:31、SEQ ID NO:32、SEQID NO:48、SEQ ID NO:49、SEQ ID NO:64以及SEQ ID NO:65中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
16、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列:
i)SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:66以及SEQ ID NO:67所提供的任何一条核苷酸序列;
ii)编码如权利要求1到3、5或10到13中任何一项所述的多肽的核苷酸序列,
iii)与SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:33、SEQ ID NO:34、SEQID NO:50、SEQ ID NO:51、SEQ ID NO:66以及SEQ ID NO:67中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
17、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列:
i)SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:52、SEQ ID NO:53、SEQ ID NO:68以及SEQ ID NO:69所提供的任何一条核苷酸序列;
ii)编码如权利要求1到3、6或10到13中任何一项所述的多肽的核苷酸序列,
iii)与SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:35、SEQ ID NO:36、SEQID NO:52、SEQ ID NO:53、SEQ ID NO:68以及SEQ ID NO:69中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
18、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列:
i)SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:37、SEQ ID NO:38、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:70、SEQ ID NO:71以及SEQ ID NO:76所提供的任何一条核苷酸序列;
ii)编码如权利要求1到3、7或10到13中任何一项所述的多肽的核苷酸序列,
iii)与SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:37、SEQ ID NO:38、SEQID NO:54、SEQ ID NO:55、SEQ ID NO:70、SEQ ID NO:71以及SEQ ID NO:76中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
19、根据权利要求14所述的多核苷酸,其中该多核苷酸包括选自下述的序列:
i)SEQ ID NO:74或SEQ ID NO:75所提供的核苷酸序列;
ii)编码如权利要求1到3、8或10到13中任何一项所述的多肽的核苷酸序列,
iii)与SEQ ID NO:74和/或SEQ ID NO:75具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
20、一种分离的和/或外源多核苷酸,该多核苷酸包括选自下述的序列:
i)SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21以及SEQ ID NO:39所提供的任何一条核苷酸序列;
ii)编码如权利要求1到3或9到13中任何一项所述的多肽的核苷酸序列,
iii)与SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21以及SEQ ID NO:39中任何一条或多条具有至少30%同源性的核苷酸序列,以及
iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。
21、包括至少一种如权利要求14到20中任何一项所述的多核苷酸的载体。
22、根据权利要求21所述的载体为表达载体。
23、包括至少一种如权利要求14到20中任何一项所述的多核苷酸,和/或至少一种如权利要求21或22所述的载体的宿主细胞。
24、根据权利要求23所述的宿主细胞是细菌、酵母或植物细胞。
25、制备如权利要求1到13中任何一项所述的多肽的方法,该方法包括在允许编码所述多肽的多核苷酸表达的条件下,培养如权利要求23或24所述的宿主细胞,或者如权利要求22所述的载体,以及回收所表达的多肽。
26、包括外源多核苷酸,编码至少一种如权利要求1到13中任何一项所述的多肽的多核苷酸的转基因植物。
27、包括外源多核苷酸,编码至少一种如权利要求1到13中任何一项所述的多肽的非人类转基因动物。
28、特异性结合如权利要求1到12中任何一项所述的多肽的抗体。
29、包括至少一种如权利要求1到13中任何一项所述的多肽的丝纤维。
30、根据权利要求29所述的丝纤维,其中至少一些所述的多肽是交联的。
31、根据权利要求30所述的丝纤维,其中至少所述的多肽的一些赖氨酸残基是交联的。
32、包括至少两种如权利要求1到13中任何一项所述的多肽的共聚物。
33、根据权利要求32所述的共聚物,其包括如权利要求4所述的多肽,如权利要求5所述的多肽,如权利要求6所述的多肽,以及如权利要求7所述的多肽。
34、根据权利要求33所述的共聚物,其进一步包括如权利要求9所述的多肽。
35、根据权利要求33或34所述的共聚物,其中至少一些所述的多肽是交联的。
36、根据权利要求35所述的共聚物,其中至少所述的多肽的一些赖氨酸残基是交联的。
37、包括至少一种如权利要求1到13中任何一项所述的多肽,如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物的产品。
38、根据权利要求37所述的产品,其中该产品选自个人护理产品、纺织品、塑料制品或生物医学产品组成的群组。
39、包括至少一种如权利要求1到13中任何一项所述的多肽,如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物,以及一种或一种以上可接受的载体的组合物。
40、根据权利要求39所述组合物进一步包括药物。
41、用作药物、或者在医疗器械或化妆品中使用的如权利要求39所述组合物。
42、包括至少一种如权利要求14到20任何一项所述的多核苷酸,以及一种或一种以上可接受的载体的组合物。
43、一种治疗或预防疾病的方法,该方法包括给予包括治疗或预防该疾病的药物和药用载体的组合物,其中所述的药用载体选自至少一种如权利要求1到13中任何一项所述的多肽,如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物。
44、至少一种如权利要求1到13中任何一项所述的多肽,如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物,以及药物,在制备治疗或预防疾病的药物中的用途。
45、包括至少一种如权利要求1到13中任何一项所述的多肽,至少一种如权利要求14到20任何一项所述的多核苷酸,至少一种如权利要求21或22所述的载体,至少一种如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物的试剂盒。
CN200680045666.2A 2005-10-05 2006-10-04 丝蛋白 Active CN101321777B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US72376605P 2005-10-05 2005-10-05
US60/723,766 2005-10-05
PCT/AU2006/001453 WO2007038837A1 (en) 2005-10-05 2006-10-04 Silk proteins

Publications (2)

Publication Number Publication Date
CN101321777A true CN101321777A (zh) 2008-12-10
CN101321777B CN101321777B (zh) 2015-10-21

Family

ID=37905912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680045666.2A Active CN101321777B (zh) 2005-10-05 2006-10-04 丝蛋白

Country Status (15)

Country Link
US (4) US9409959B2 (zh)
EP (2) EP2395014A3 (zh)
JP (2) JP5748392B2 (zh)
KR (1) KR20080056255A (zh)
CN (1) CN101321777B (zh)
AU (1) AU2006299740B2 (zh)
BR (1) BRPI0616894B8 (zh)
CA (1) CA2624667C (zh)
DK (1) DK1931702T3 (zh)
ES (1) ES2403733T3 (zh)
HK (1) HK1119718A1 (zh)
NZ (1) NZ567202A (zh)
RU (1) RU2467015C2 (zh)
WO (1) WO2007038837A1 (zh)
ZA (1) ZA200803178B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104039965A (zh) * 2011-11-16 2014-09-10 联邦科学工业研究组织 胶原蛋白样丝基因
CN110016438A (zh) * 2019-01-29 2019-07-16 西北大学 一种真菌菌株及其菌丝体的液体培养方法
US10575629B2 (en) 2015-11-03 2020-03-03 Colgate-Palmolive Company Bristle and toothbrush incorporating the same
CN113564927A (zh) * 2014-12-02 2021-10-29 丝绸医疗公司 丝性能服装和产品及其制备方法

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358101A (ja) * 1986-08-29 1988-03-12 Hitachi Ltd 位置検出装置
SG164370A1 (en) 2004-05-14 2010-09-29 Quill Medical Inc Suture methods and devices
EP2395014A3 (en) * 2005-10-05 2012-07-11 Commonwealth Scientific and Industrial Research Organization Silk proteins
EP2086749B1 (en) 2006-11-03 2013-05-08 Trustees Of Tufts College Nanopatterned biopolymer optical device and method of manufacturing the same
CA2704309C (en) 2006-11-03 2017-02-28 Trustees Of Tufts College Electroactive biopolymer optical and electro-optical devices and method of manufacturing the same
US8529835B2 (en) * 2006-11-03 2013-09-10 Tufts University Biopolymer sensor and method of manufacturing the same
US8915943B2 (en) 2007-04-13 2014-12-23 Ethicon, Inc. Self-retaining systems for surgical procedures
WO2009018610A1 (en) * 2007-08-06 2009-02-12 Commonwealth Scientific Industrial Research Organisation Cross-beta silk genes
US8777987B2 (en) 2007-09-27 2014-07-15 Ethicon, Inc. Self-retaining sutures including tissue retainers having improved strength
US20100285593A1 (en) * 2007-11-26 2010-11-11 Waters Technologies Corporation Internal standards and methods for use in quantitatively measuring analytes in a sample
US8771313B2 (en) 2007-12-19 2014-07-08 Ethicon, Inc. Self-retaining sutures with heat-contact mediated retainers
US8916077B1 (en) 2007-12-19 2014-12-23 Ethicon, Inc. Self-retaining sutures with retainers formed from molten material
US8118834B1 (en) 2007-12-20 2012-02-21 Angiotech Pharmaceuticals, Inc. Composite self-retaining sutures and method
EP2242430B1 (en) 2008-01-30 2016-08-17 Ethicon, LLC Apparatus and method for forming self-retaining sutures
WO2009105663A2 (en) 2008-02-21 2009-08-27 Angiotech Pharmaceuticals, Inc. Method and apparatus for elevating retainers on self-retaining sutures
US8641732B1 (en) 2008-02-26 2014-02-04 Ethicon, Inc. Self-retaining suture with variable dimension filament and method
JP5619726B2 (ja) 2008-04-15 2014-11-05 エシコン・エルエルシーEthicon, LLC 双方向リテーナ又は一方向リテーナを持つ自己保持縫合材
US8961560B2 (en) 2008-05-16 2015-02-24 Ethicon, Inc. Bidirectional self-retaining sutures with laser-marked and/or non-laser marked indicia and methods
AU2009319965B2 (en) 2008-11-03 2014-11-06 Ethicon Llc Length of self-retaining suture and method and device for using the same
EP2451953A4 (en) * 2009-07-10 2013-07-03 Tufts College GEN-MANIPULATED SILK PROTEIN-BASED NUCLEIC ACID DELIVERY SYSTEMS
KR20170054542A (ko) * 2009-08-26 2017-05-17 커먼웰쓰 사이언티픽 앤드 인더스트리얼 리서치 오가니제이션 실크 도프의 제조 방법
EP2509994B1 (en) * 2009-12-08 2018-09-26 AMSilk GmbH Silk Protein Coatings
BR112012028331B1 (pt) 2010-05-04 2020-04-28 Ethicon Endo Surgery Llc sutura de autorretenção
CN103068323B (zh) 2010-06-11 2015-07-22 伊西康有限责任公司 用于内窥镜式和机器人辅助式外科手术的缝合线递送工具
CN103747746B (zh) 2010-11-03 2017-05-10 伊西康有限责任公司 药物洗脱自固位缝合线及其相关方法
RU2580479C2 (ru) 2010-11-09 2016-04-10 ЭТИКОН ЭлЭлСи Самоудерживающиеся шовные материалы для неотложной помощи и упаковки для них
AU2012230716B2 (en) 2011-03-23 2016-05-19 Ethicon Llc Self-retaining variable loop sutures
US20130172931A1 (en) 2011-06-06 2013-07-04 Jeffrey M. Gross Methods and devices for soft palate tissue elevation procedures
CA2904749A1 (en) * 2012-03-26 2013-10-03 Commonwealth Scientific And Industrial Research Organisation Silk polypeptides
SG11201704010UA (en) 2014-08-20 2017-06-29 Silk Tech Ltd Fibroin-derived protein composition
AU2015349609B2 (en) * 2014-11-17 2020-09-24 Commonwealth Scientific And Industrial Research Organisation Metalloprotein compositions
CA2992462A1 (en) 2015-07-14 2017-01-19 Silk Therapeutics, Inc. Silk performance apparel and products and methods of preparing the same
JP2019519596A (ja) 2016-04-08 2019-07-11 コーネル・ユニバーシティーCornell University シルク由来タンパク質を使用して創傷治癒を増進する方法
KR102275012B1 (ko) 2016-08-12 2021-07-07 실크 테크놀로지스 리미티드 염증 치료용 실크 유래 단백질
IL266112B1 (en) 2016-10-17 2024-03-01 Pfizer Antibodies against EDB and antibody-drug conjugates
WO2019067745A1 (en) 2017-09-27 2019-04-04 Silk, Inc. SILK-COATED FABRICS, PRODUCTS AND PREPARATION METHODS THEREFOR
US20210338890A1 (en) * 2018-10-05 2021-11-04 Hiroshima University Meniscus regeneration material
US20220332948A1 (en) * 2021-04-14 2022-10-20 Cambridge Crops, Inc. Silk Packaging Applications

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4720312U (zh) 1971-01-21 1972-11-07
DE3121241C2 (de) 1980-05-28 1984-07-19 Dainippon Ink And Chemicals, Inc., Tokio/Tokyo Verfahren zum Herstellen eines Verbundkunststoffrohres aus thermoplastischem Harz
US4943674A (en) 1987-05-26 1990-07-24 Calgene, Inc. Fruit specific transcriptional factors
GB8607679D0 (en) 1986-03-27 1986-04-30 Winter G P Recombinant dna product
JPH0723585B2 (ja) 1989-11-06 1995-03-15 信越化学工業株式会社 ウール処理剤
US5989894A (en) 1990-04-20 1999-11-23 University Of Wyoming Isolated DNA coding for spider silk protein, a replicable vector and a transformed cell containing the DNA
DE69131969T2 (de) * 1990-04-20 2000-06-15 Univ Wyoming Laramie Für Spinnenseideprotein kodierende DNS, DNS enthaltender Vektor, transformierte Zelle und Produkte davon
FR2695558B1 (fr) 1992-09-11 1994-10-21 Oreal Composition cosmétique contenant des particules solides revêtues avec un polymère amphotère.
JPH08511426A (ja) 1993-06-15 1996-12-03 イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー 新規の組換え産生性クモシルクアナログ
CA2206852A1 (en) 1994-12-07 1996-06-13 Novo Nordisk A/S Polypeptide with reduced allergenicity
US5939288A (en) 1995-06-07 1999-08-17 Iowa State University Research Foundation, Inc. Plant secretory signal peptides and nectarins
ATE261297T1 (de) 1995-06-26 2004-03-15 Hans Schwarzkopf & Henkel Gmbh Haarfärbemittel mit mindestens einem pflegestoff
US6013250A (en) 1995-06-28 2000-01-11 L'oreal S. A. Composition for treating hair against chemical and photo damage
AU7152996A (en) * 1995-08-22 1997-03-19 Richard M. Basel Cloning methods for high strength spider silk proteins
US5792294A (en) 1995-11-16 1998-08-11 Otis Elevator Company Method of replacing sheave liner
US6398821B1 (en) 1996-12-23 2002-06-04 The Procter & Gamble Company Hair coloring compositions
JP3545588B2 (ja) 1997-03-24 2004-07-21 株式会社資生堂 毛髪化粧料
CN1116904C (zh) 1997-06-18 2003-08-06 独立行政法人农业生物资源研究所 以丝心蛋白和丝胶蛋白为主的创伤用被敷材料及其制法
EP1002064B1 (en) 1997-06-25 2007-10-10 Novozymes A/S A modified polypeptide
US6284246B1 (en) 1997-07-30 2001-09-04 The Procter & Gamble Co. Modified polypeptides with high activity and reduced allergenicity
FR2774588B1 (fr) 1998-02-11 2000-05-05 Oreal Composition cosmetique ou dermatologique contenant au moins une proteine de soie d'arachnides naturelle, recombinante ou un analogue
DE19848002A1 (de) 1998-10-17 2000-04-20 Goldschmidt Ag Th Polypeptid-Polysiloxan-Copolymere
JP2000139755A (ja) 1998-11-12 2000-05-23 Miki Tokushu Seishi Kk あぶらとり紙及びその製造方法
JP2000328460A (ja) 1999-05-24 2000-11-28 Dow Corning Toray Silicone Co Ltd 水系繊維処理剤および繊維の処理方法
EP1074617A3 (en) * 1999-07-29 2004-04-21 Research Association for Biotechnology Primers for synthesising full-length cDNA and their use
JP4570188B2 (ja) * 1999-11-24 2010-10-27 独立行政法人 日本原子力研究開発機構 絹繊維を微粉末化及び水溶化する方法
US6608242B1 (en) * 2000-05-25 2003-08-19 E. I. Du Pont De Nemours And Company Production of silk-like proteins in plants
GB0108181D0 (en) 2001-04-02 2001-05-23 Xiros Plc Silk-based fibre
WO2002099082A2 (en) 2001-06-06 2002-12-12 University Of Wyoming Expression of spider silk proteins in higher plants
US7521228B2 (en) 2001-08-29 2009-04-21 The University Of Wyoming Spider silk protein encoding nucleic acids, polypeptides, antibodies and methods of use thereof
ITVR20010098A1 (it) 2001-09-11 2003-03-11 Consorzio Per Gli Studi Uni Procedimento per l'ottenimento di idrogeli di fibroina di seta.
US20050055051A1 (en) 2001-09-13 2005-03-10 Grafton R. Donald High strength suture with silk trace
US6902932B2 (en) 2001-11-16 2005-06-07 Tissue Regeneration, Inc. Helically organized silk fibroin fiber bundles for matrices in tissue engineering
WO2003060207A1 (en) 2002-01-09 2003-07-24 E. I. Du Pont De Nemours And Company Polypeptide fibers and processes for making them
WO2003060099A2 (en) 2002-01-11 2003-07-24 Nexia Biotechnologies, Inc. Methods and apparatus for spinning spider silk protein
JPWO2003100065A1 (ja) * 2002-05-23 2005-09-22 国立大学法人東京農工大学 絹タンパク質、及び、機能性を付与した遺伝子組換え絹様タンパク質の大量生産方法
US7516525B2 (en) 2002-06-13 2009-04-14 Texas Tech University Process for making chemical protective wipes and such wipes
JP3772207B2 (ja) 2002-06-19 2006-05-10 独立行政法人農業生物資源研究所 生分解性生体高分子材料、その製造方法、およびこの高分子材料からなる機能性素材
GB0218977D0 (en) * 2002-08-15 2002-09-25 Univ York Polypeptide
US20040132978A1 (en) 2002-11-12 2004-07-08 Fahnestock Stephen R. Method for purifying and recovering silk proteins in soluble form and uses thereof
WO2004060424A2 (en) 2002-12-30 2004-07-22 Angiotech International Ag Silk-containing stent graft
NO316350B1 (no) 2003-02-07 2004-01-12 Hiform As Laminat og framgangsmåte for framstilling av et fiberarmert laminert motstandselement
US7060260B2 (en) 2003-02-20 2006-06-13 E.I. Du Pont De Nemours And Company Water-soluble silk proteins in compositions for skin care, hair care or hair coloring
US7115388B2 (en) 2003-03-14 2006-10-03 National Institute Of Agrobiological Sciences Production of functional polypeptides originating from silk protein and use thereof
JP4357859B2 (ja) 2003-03-24 2009-11-04 トヨタ自動車株式会社 繊維複合樹脂品及びその製造方法
RU2236843C1 (ru) * 2003-08-05 2004-09-27 Злобин Виктор Сергеевич Лечебно-косметическое средство
DE10336509A1 (de) 2003-08-08 2005-03-03 Ledertech Gmbh Verbundmaterial für thermisch formbare Schuhkomponenten auf organischer Faserbasis
US20070082197A1 (en) 2003-11-04 2007-04-12 Ko Frank K Electrospun carbon nanotube reinforced silk fibers
US7314851B2 (en) 2003-12-11 2008-01-01 The Foundation for the Promotion of Supplementary Occupations and Related Techniques of her Majesty Queen Sirikit Silk soap comprising sericin protein
JP4815108B2 (ja) 2003-12-26 2011-11-16 イビデン株式会社 ハニカム構造体
US20050161058A1 (en) 2004-01-26 2005-07-28 Israel Yerushalmy Spider silk dental floss
EP2395014A3 (en) * 2005-10-05 2012-07-11 Commonwealth Scientific and Industrial Research Organization Silk proteins

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104039965A (zh) * 2011-11-16 2014-09-10 联邦科学工业研究组织 胶原蛋白样丝基因
CN104039965B (zh) * 2011-11-16 2017-07-21 联邦科学工业研究组织 胶原蛋白样丝基因
CN113564927A (zh) * 2014-12-02 2021-10-29 丝绸医疗公司 丝性能服装和产品及其制备方法
US11649585B2 (en) 2014-12-02 2023-05-16 Evolved By Nature, Inc. Silk performance apparel and products and methods of preparing the same
US10575629B2 (en) 2015-11-03 2020-03-03 Colgate-Palmolive Company Bristle and toothbrush incorporating the same
CN110016438A (zh) * 2019-01-29 2019-07-16 西北大学 一种真菌菌株及其菌丝体的液体培养方法
CN110016438B (zh) * 2019-01-29 2021-04-13 西北大学 一种真菌菌株及其菌丝体的液体培养方法

Also Published As

Publication number Publication date
US20100100975A1 (en) 2010-04-22
CA2624667C (en) 2018-01-09
JP2009509550A (ja) 2009-03-12
RU2467015C2 (ru) 2012-11-20
KR20080056255A (ko) 2008-06-20
EP1931702A4 (en) 2009-01-21
US20170051025A1 (en) 2017-02-23
EP2395014A2 (en) 2011-12-14
JP6339459B2 (ja) 2018-06-06
RU2008117631A (ru) 2009-11-10
DK1931702T3 (da) 2013-04-15
JP5748392B2 (ja) 2015-07-15
CN101321777B (zh) 2015-10-21
ZA200803178B (en) 2009-08-26
US20210094989A1 (en) 2021-04-01
BRPI0616894A2 (pt) 2011-07-05
NZ567202A (en) 2012-02-24
WO2007038837A1 (en) 2007-04-12
AU2006299740B2 (en) 2012-07-05
BRPI0616894B1 (pt) 2017-05-23
AU2006299740A1 (en) 2007-04-12
EP1931702A1 (en) 2008-06-18
HK1119718A1 (en) 2009-03-13
US8481681B2 (en) 2013-07-09
BRPI0616894B8 (pt) 2021-07-27
US9409959B2 (en) 2016-08-09
EP1931702B1 (en) 2013-01-02
ES2403733T3 (es) 2013-05-21
CA2624667A1 (en) 2007-04-12
EP2395014A3 (en) 2012-07-11
JP2015002746A (ja) 2015-01-08
US20120245103A1 (en) 2012-09-27

Similar Documents

Publication Publication Date Title
CN101321777B (zh) 丝蛋白
KR101932771B1 (ko) 실크 도프의 제조 방법
CN101679975A (zh) 来自Nephilengys Cruentata蜘蛛、黄带粉趾食鸟蛛和Parawixia Bistriata蜘蛛的网的蛋白
AU2012339619B2 (en) Collagen-like silk genes
AU2013239320B2 (en) Silk polypeptides
US20110177997A1 (en) Cross-Beta Silk Genes
NZ626091B2 (en) Collagen-like silk genes
NO860223L (no) Fremgangsmaate for fremstilling av silkeproteiner.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant