CN101321777A

CN101321777A - 丝蛋白

Info

Publication number: CN101321777A
Application number: CNA2006800456662A
Authority: CN
Inventors: T·D·萨瑟兰; V·S·哈里托斯; H·特鲁曼; A·斯里斯坎瑟; S·韦斯曼; P·M·坎贝尔
Original assignee: Commonwealth Scientific and Industrial Research Organization CSIRO
Current assignee: Commonwealth Scientific and Industrial Research Organization CSIRO
Priority date: 2005-10-05
Filing date: 2006-10-04
Publication date: 2008-12-10
Anticipated expiration: 2026-10-04
Also published as: US20100100975A1; CA2624667C; JP2009509550A; RU2467015C2; KR20080056255A; EP1931702A4; US20170051025A1; EP2395014A2; JP6339459B2; RU2008117631A; DK1931702T3; JP5748392B2; CN101321777B; ZA200803178B; US20210094989A1; BRPI0616894A2; NZ567202A; WO2007038837A1; AU2006299740B2; BRPI0616894B1

Abstract

本发明提供丝蛋白，以及编码这些蛋白的核酸。本发明也提供合成丝蛋白的重组细胞和/或有机体。本发明的丝蛋白可有多种用途，如用于生产个人护理产品、塑料制品、纺织品和生物医学产品。

Description

丝蛋白

发明领域

本发明涉及丝蛋白，以及编码此类蛋白的核酸。本发明也涉及合成丝蛋白的重组细胞和/或有机体。本发明的丝蛋白可有多种用途，如用于生产个人护理产品、塑料制品、纺织品和生物医学产品。

发明背景

丝是表现出特别强度和韧性的纤维状蛋白质分泌物，因此是广泛研究的对象。超过30,000种蜘蛛和许多昆虫产丝。其中很少得到性质描述，而大部分研究集中在家蚕(Bombyx mori)的茧丝和织网蜘蛛棒络新妇蛛(Nephila clavipes)的拖丝上。

在鳞翅目和蜘蛛中，丝心蛋白基因编码的蛋白一般很大，在两个末端都有显著的亲水末端结构域，其间跨过疏水块和亲水块交替出现的大范围的区域(Bini等人，2004)。这些蛋白一般包括与β折叠、β螺旋(β-spirals)、α螺旋和无定形区松散关联的β折叠层的晶列(crystalline arrays)的不同组合(见Craig和Riekel，2002年综述)。

由于丝纤维代表了一些已知最强的自然纤维，人们对其进行了广泛的研究，以期能重现其合成过程。然而，由于丝基因中存在重复核苷酸基序(motifs)，它们会导致有害重组事件发生，而且丝基因很大，基因中每个氨基酸使用少数密码子导致宿主细胞tRNA库耗尽，上述因素的组合使得在许多不同重组表达系统中表达鳞翅目和蜘蛛丝心蛋白基因时，经常出现低表达率的问题。重组表达会导致翻译过程中的困难，如由于密码子偏爱和密码子需求而导致翻译中止，以及由于高重组率导致基因截断。至今为止，较短和较少的重复序列可以避免许多与丝基因表达有关的问题。

与对鳞翅目(特别是家蚕的茧丝)和蜘蛛(特别是棒络新妇蛛的拖丝)所积累的广泛知识相比，人们对其它昆虫丝的化学组成和分子组织所知甚少。

在20世纪60年代早期，对蜜蜂幼虫唾液腺丝纤维的X射线衍射图谱分析表明针尾类膜翅目昆虫的丝具有α-螺旋结构(Rudall，1962)。同时证明该丝是螺旋的，获得的图谱显示了α-螺旋链的卷曲螺旋(coiled-coil)系统(Atkins，1967)。来源于其它针尾类物种包括黄蜂(wasp)，虎头蜂(Pseudopompilus humbolti)(Rudall，1962)和熊蜂(bumblebee)，明亮熊蜂(Bombus lucorum)(Lucas和Rudall，1967)的茧丝显示出相似的X射线衍射图谱。

与针尾类丝中α-螺旋结构形成对比的是，与针尾类相关的进化枝上的姬蜂总科(Ichneumonoidea)的丝的特点是具有平行-β结构。人们已经对具有这种结构的茧蜂科四例(粉蝶盘绒茧蜂，Cotesia(＝Apenteles)glomerate ；Cotesia(＝Apenteles)gonopterygis；Apenteles hignelli)和姬蜂科三例(Dusona sp.；Phytodietris sp.；Branchus femoralis)的X射线衍射图谱进行了描述(Lucas和Rudall，1967)。此外已经对一个茧蜂科(粉蝶盘绒茧蜂(Cotesia glomerate))丝的序列进行了描述(Genbank数据库登录号为AB 188680；Yamada等人，2004)。这一部分的蛋白序列包括一个高度保守的28X-天冬酰胺重复(其中X为丙氨酸或丝氨酸)，并未预测到含有形成卷曲螺旋的七肽重复(heptad repeats)。对茧蜂科茧丝氨基酸组成的广泛分析表明小腹茧蜂亚科的丝具有高天冬酰胺和丝氨酸成分而与其它丝不同(Lucas等人，1960；Quicke等人，2004)。相关亚科产生具有显著不同氨基酸组成的丝表明小腹茧蜂亚科在其亚科内是特异进化的(Yamada等人，2004)。使用根据分离茧丝蛋白内部肽序列设计的PCR引物分离了粉蝶盘绒茧蜂的部分cDNA序列。根据这一部分序列预测的氨基酸组成和来源于该种的广泛水洗丝(extensively washed silk)氨基酸组成十分相似。

其它非针尾类细蜂亚目和其余的膜翅目昆虫(广腰亚目)的丝是十分普通的平行-β折叠，叶蜂科产生类胶原和多聚甘氨酸两种丝(Lucas和Rudall，1967)。

蜜蜂丝蛋白在末龄幼虫中期合成，可视为解聚丝蛋白的混合(Silva-Zacarin等人，2003)。随着龄期的进行，腺体中的水被去除，脱水导致丝蛋白聚合形成组织有序的丝标记的类晶团聚体(Silva-Zacarin等人，2003)。进行性脱水导致类晶团聚体进一步重组织(Silva-Zacarin等人，2003)并可能在丝间形成新的丝间结合(Rudall，1962)。从蜜蜂丝腺分离的原纤维电镜图片显示直径约20-25埃的结构(Flower和Kenchington，1967)。这一数值与3-、4-、5-股卷曲螺旋(coiled coil)一致。

Lucas和Rudall确定了不同针尾类膜翅目种的丝的氨基酸组成(1967)，发现与经典丝心蛋白相比其包括高含量的丙氨酸、丝氨酸、酸性残基、天冬氨酸、谷氨酸，以及低含量的甘氨酸。针尾类膜翅目昆虫的丝的螺旋结构被认为是由于低甘氨酸含量和高酸性残基含量的结果(Rudall和Kenchington，1971)。

人们对于草蜻蛉(lacewing，也称草蛉、草蛉虫)(目：脉翅目)幼虫的丝所知甚少。其茧包括两层，一个内层固体层和一个外层纤维层。以前该茧被描述为包括壳脂蛋白丝(Rudall和Kenchington，1971)，这一描述仅与内层固体层有关。LaMunyon(1988)描述了一种构成外层纤维的马氏管分泌的物质。这一层沉积之后，有大量绒毛的内腔表皮细胞的分泌物构成固体内壁(LaMunyon，1988)。

同样已知的是草蜻蛉幼虫所有龄期都从马氏管产生蛋白质粘性物质将幼虫粘到基质上，将伪装物粘到背上或使猎物陷入(Speilger，1962)。Lomamyia(Bethothidae)属的幼虫同时产生丝和粘性物质，人们推定这它们很可能是相同物质(Speilger，1962)。该粘性分泌物是高度可溶的，也被认为与抵抗捕食者的防卫有关(LaMunyon&Adams，1987)。

考虑到诸如膜翅目和脉翅目昆虫所产生丝的独特属性，有必要从这些生物中鉴定新的编码丝蛋白的氨基酸。

发明概述

本发明已从昆虫中鉴定出数目众多的丝蛋白。这些丝蛋白与其它已知丝蛋白在一级序列、二级结构和/或氨基酸含量方面有惊人的差异。

因此，本发明第一方面提供一种基本上纯化的和/或重组的丝多肽，其中至少该丝多肽的一部分具有卷曲螺旋结构。

现有技术已知多肽的卷曲螺旋结构具有特征性七肽重复序列，以共有序列(abcdefg)n表示，其中a和d位一般为疏水残基，其余位置一般为极性残基。令人吃惊的是，本发明多肽的七肽总体看来具有新颖的组成——在疏水七肽位置a和d位异乎寻常地富含丙氨酸。此外，在这些位置含有高水平的小的极性残基。更进一步而言，e位也有高水平的丙氨酸和小的疏水残基。

相应地，在一个特别优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg，并且至少25％的a和d位氨基酸是丙氨酸残基。

在另一个优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg，并且至少25％的a、d和e位氨基酸是丙氨酸残基。

在另一个优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg，并且至少25％的a位氨基酸是丙氨酸残基。

在另一个优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg，并且至少25％的d位氨基酸是丙氨酸残基。

在另一个优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg，并且至少25％的e位氨基酸是丙氨酸残基。

在一个特别优选实施方式中，所述的至少10拷贝的七肽序列是连续的。

在另一个优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg，并且至少15％的a和d位氨基酸是丙氨酸残基。

在另一个优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg，并且至少15％的a、d和e位氨基酸是丙氨酸残基。

在另一个优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg，并且至少15％的a氨基酸是丙氨酸残基。

在另一个优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg，并且至少15％的d位氨基酸是丙氨酸残基。

在另一个优选实施方式中，具有卷曲螺旋结构的该多肽部分包括至少5拷贝的七肽序列abcdefg，并且至少15％的e位氨基酸是丙氨酸残基。

在一个特别优选实施方式中，所述的至少5拷贝的七肽序列是连续的。

在一个实施方式中，所述的多肽包括选自下述的序列：

i)SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：22、SEQ ID NO：23、SEQ IDNO：40、SEQ ID NO：41、SEQ ID NO：56以及SEQ ID NO：57所提供的任何一条氨基酸序列；

ii)与SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：22、SEQ ID NO：23、SEQ IDNO：40、SEQ ID NO：41、SEQ ID NO：56以及SEQ ID NO：57中任何一条或多条具有至少30％同源性的氨基酸序列；以及

iii)i)或ii)的生物活性片段。

在另外一个实施方式中，所述的多肽包括选自下述的序列：

i)SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：24、SEQ ID NO：25、SEQ IDNO：42、SEQ ID NO：43、SEQ ID NO：58以及SEQ ID NO：59所提供的任何一条氨基酸序列；

ii)与SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：24、SEQ ID NO：25、SEQ IDNO：42、SEQ ID NO：43、SEQ ID NO：58以及SEQ ID NO：59中任何一条或多条具有至少30％同源性的氨基酸序列；以及

iii)i)或ii)的生物活性片段。

在另外一个实施方式中，所述的多肽包括选自下述的序列：

i)SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：26、SEQ ID NO：27、SEQ IDNO：44、SEQ ID NO：45、SEQ ID NO：60以及SEQ ID NO：61所提供的任何一条氨基酸序列；

ii)与SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：26、SEQ ID NO：27、SEQ IDNO：44、SEQ ID NO：45、SEQ ID NO：60以及SEQ ID NO：61中任何一条或多条具有至少30％同源性的氨基酸序列；以及

iii)i)或ii)的生物活性片段。

在另外一个实施方式中，所述的多肽包括选自下述的序列：

i)SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：28、SEQ ID NO：29、SEQ IDNO：46、SEQ ID NO：47、SEQ ID NO：62以及SEQ ID NO：63所提供的任何一条氨基酸序列；

ii)与SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：28、SEQ ID NO：29、SEQ IDNO：46、SEQ ID NO：47、SEQ ID NO：62以及SEQ ID NO：63中任何一条或多条具有至少30％同源性的氨基酸序列；以及

iii)i)或ii)的生物活性片段。

在另外一个实施方式中，所述的多肽包括选自下述的序列：

i)SEQ ID NO：72或SEQ ID NO：73所提供的氨基酸序列；

ii)与SEQ ID NO：72和/或SEQ ID NO：73具有至少30％同源性的氨基酸序列；以及

iii)i)或ii)的生物活性片段。

与本发明第一方面有关的更多丝蛋白已得到鉴定。这些蛋白其中之一(SEQ IDNO：10)被PROFsec预测为含有41％的α螺旋、8％的β折叠和50％的环的二级结构，因而被归入混合结构蛋白一类。对该蛋白的MARCOIL分析仅预测出一个短的七肽重复区，这是具有卷曲螺旋结构蛋白的特征性结构。

相应地，本发明第二方面提供一种基本上纯化的和/或重组的丝多肽，其包括选自下述的序列：

i)SEQ ID NO：9、SEQ ID NO：10以及SEQ ID NO：30所提供的任何一条氨基酸序列；

ii)与SEQ ID NO：9、SEQ ID NO：10以及SEQ ID NO：30具有至少30％同源性的氨基酸序列；以及

iii)i)或ii)的生物活性片段。

若不被理论所限，似乎第一方面的四种蛋白质的螺旋轴相互平行地缠绕形成束，这些束沿轴向延长形成原纤维。此外，据预测至少在象蜜蜂和熊蜂这样的物种中，第二方面的蛋白起“胶”的作用，辅助将许多第一方面的卷曲螺旋蛋白束粘合在一起形成纤维蛋白复合体。然而，即使没有第二方面的多肽，仍然可以形成丝纤维和共聚物。

在一个优选实施方式中，本发明的多肽可从膜翅目或脉翅目昆虫的物种中纯化获得，或是纯化获得的多肽的突变体。优选地，膜翅目昆虫的物种为意大利蜂(Apis mellifera)、黄猄蚁(Oecophylla smaragdina)、牛头犬蚁(Myrmecia foricata)或授粉熊蜂(Bombus terrestris)。优选地，脉翅目昆虫的物种为玛草蛉(Malladasignata)。

另一方面，本发明提供本发明多肽与至少一种其他多肽融合。

在一个优选的实施方式中，所述的至少一种其他多肽选自：提高本发明多肽稳定性的多肽、辅助所述的融合蛋白纯化的多肽或辅助本发明的多肽从细胞中分泌的多肽(例如从植物细胞中分泌)。

另一方面，本发明提供编码丝多肽的分离的和/或外源多核苷酸，其中该丝多肽至少一部分具有卷曲螺旋结构。

在一个实施方式中，所述的多核苷酸包括选自下述的序列：

i)SEQ ID NO：11、SEQ ID NO：12、SEQ ID NO：31、SEQ ID NO：32、SEQ IDNO：48、SEQ ID NO：49、SEQ ID NO：64以及SEQ ID NO：65所提供的任何一条核苷酸序列；

ii)编码本发明多肽的核苷酸序列，

iii)与SEQ ID NO：11、SEQ ID NO：12、SEQ ID NO：31、SEQ ID NO：32、SEQID NO：48、SEQ ID NO：49、SEQ ID NO：64以及SEQ ID NO：65中任何一条或多条具有至少30％同源性的核苷酸序列，以及

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

在另一个实施方式中，所述的多核苷酸包括选自下述的序列：

i)SEQ ID NO：13、SEQ ID NO：14、SEQ ID NO：33、SEQ ID NO：34、SEQ IDNO：50、SEQ ID NO：51、SEQ ID NO：66以及SEQ ID NO：67所提供的任何一条核苷酸序列；

ii)编码本发明多肽的核苷酸序列，

iii)与SEQ ID NO：13、SEQ ID NO：14、SEQ ID NO：33、SEQ ID NO：34、SEQID NO：50、SEQ ID NO：51、SEQ ID NO：66以及SEQ ID NO：67中任何一条或多条具有至少30％同源性的核苷酸序列，以及

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

在另外一个实施方式中，所述的多核苷酸包括选自下述的序列：

i)SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：35、SEQ ID NO：36、SEQ IDNO：52、SEQ ID NO：53、SEQ ID NO：68以及SEQ ID NO：69所提供的任何一条核苷酸序列；

ii)编码本发明多肽的核苷酸序列，

iii)与SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：35、SEQ ID NO：36、SEQID NO：52、SEQ ID NO：53、SEQ ID NO：68以及SEQ ID NO：69中任何一条或多条具有至少30％同源性的核苷酸序列，以及

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

i)SEQ ID NO：17、SEQ ID NO：18、SEQ ID NO：37、SEQ ID NO：38、SEQ IDNO：54、SEQ ID NO：55、SEQ ID NO：70、SEQ ID NO：71以及SEQ ID NO：76所提供的任何一条核苷酸序列；

ii)编码本发明多肽的核苷酸序列，

iii)与SEQ ID NO：17、SEQ ID NO：18、SEQ ID NO：37、SEQ ID NO：38、SEQID NO：54、SEQ ID NO：55、SEQ ID NO：70、SEQ ID NO：71以及SEQ ID NO：76中任何一条或多条具有至少30％同源性的核苷酸序列，以及

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

i)SEQ ID NO：74或SEQ ID NO：75所提供的核苷酸序列；

ii)编码本发明多肽的核苷酸序列，

iii)与SEQ ID NO：74和/或SEQ ID NO：75具有至少30％同源性的核苷酸序列，以及

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

另一方面，本发明提供分离的和/或外源多核苷酸，该多核苷酸包括选自下述的序列：

i)SEQ ID NO：19、SEQ ID NO：20、SEQ ID NO：21以及SEQ ID NO：39所提供的任何一条核苷酸序列；

ii)编码本发明多肽的核苷酸序列，

iii)与SEQ ID NO：19、SEQ ID NO：20、SEQ ID NO：21以及SEQ ID NO：39中任何一条或多条具有至少30％同源性的核苷酸序列，以及

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

在一个优选实施方式中，本发明的多核苷酸可从膜翅目或脉翅目昆虫的物种中分离获得，或是分离获得的多核苷酸的突变体。优选地，膜翅目昆虫的物种为意大利蜂(Apis mellifera)、黄猄蚁(Oecophylla smaragdina)、牛头犬蚁(Myrmeciaforicata)或授粉熊蜂(Bombus terrestris)。优选地，脉翅目昆虫的物种为玛草蛉(Mallada signata)。

另一方面，本发明提供包括至少一种本发明多核苷酸的载体。

优选地，该载体为表达载体。

另一方面，本发明提供包括至少一种本发明多核苷酸和/或至少一种本发明载体的宿主细胞。

该宿主细胞可为任何类型的细胞，其例子包括但不限于细菌、酵母或植物细胞。

本发明也提供制备本发明多肽的方法，该方法包括在允许编码所述多肽的多核苷酸表达条件下，培养本发明的宿主细胞，或本发明的载体，以及回收所表达的多肽。

可想而知转基因植物在生产本发明多肽中特别有用。因此，另一方面，本发明提供包括包括外源多核苷酸，编码至少一种本发明的多肽的转基因植物。

另一方面，本发明提供包括外源多核苷酸，编码至少一种本发明的多肽的非人类转基因动物。

另一方面，本发明提供特异性结合本发明多肽的抗体。

另一方面，本发明提供包括至少一种本发明多肽的丝纤维。

优选地，该多肽是一种重组多肽。

在一个实施方式中，至少一些所述的多肽是交联的。在一个实施方式中，至少所述的多肽的一些赖氨酸残基是交联的。

另一方面，本发明提供包括至少两种本发明多肽的共聚物。

优选地，所述的多肽是重组多肽。

在一个实施方式中，所述的共聚物包括至少四种不同的第一方面的多肽。在另一个实施方式中，所述的共聚物进一步包括一种第二方面的多肽。

本领域技术人员会理解本发明多肽具有如所属领域其它类型丝蛋白一样具有广泛的已知的用途。因此，另一方面，本发明提供包括至少一种本发明多肽，本发明丝纤维和/或本发明共聚物的产品。

产品的例子包括但不限于个人护理产品、纺织品、塑料制品和生物医学产品。

另一方面，本发明提供包括至少一种本发明多肽、本发明丝纤维和/或本发明共聚物，以及一种或一种以上可接受的载体的组合物。

在一个实施方式中，所述的组合物进一步包括药物。

在另一个实施方式中，所述的组合物用作药物、或者在医疗器械或化妆品中使用。

另一方面，本发明提供包括至少一种本发明多核苷酸，以及一种或一种以上可接受的载体的组合物。

在一个优选实施方式中，本发明的组合物、丝纤维、共聚物和/或产品不包括昆虫产生的王浆蛋白。

另一方面，本发明提供一种治疗或预防疾病的方法，该方法包括给予包括治疗或预防该疾病的药物和药用载体的组合物，其中药用载体选自至少一种本发明多肽、本发明丝纤维和/或本发明共聚物。

另一方面，本发明提供至少一种本发明多肽、本发明丝纤维和/或本发明共聚物，以及药物，在制备治疗或预防疾病的药物中的用途。

另一方面，本发明提供包括至少一种本发明多肽、至少一种本发明多核苷酸、至少一种本发明载体、至少一种本发明丝纤维和/或本发明共聚物的试剂盒。

优选地，所述的试剂盒进一步包括使用该试剂盒的信息和/或说明。

很明显，本发明一个方面的优选特征和特性也可用于本发明其他许多方面。

整个说明书中所用的词语“包括(comprise)”或其变体“包括(comprises)”或“包括(comprising)”，应理解为是指含有所述的成分、整体或步骤，或成分、整体或步骤组成的组，但不排除任何其他成分、整体或步骤，或成分、整体或步骤组成的组。

下文中本发明通过下述非限定实施例并对附图附有参考的方式进行描述。

附图说明

图1.下列丝的酰胺I区和II区的傅立叶变换红外光谱：1)蜜蜂丝，2)熊蜂丝，3)牛头犬蚁(bulldog ant)丝，4)织工蚁(weaver ant)丝，5)草蜻蛉(lacewing)幼虫丝。上述所有的丝都具有光谱预期的螺旋蛋白。膜翅目昆虫的丝(蚂蚁和蜜蜂)在1645-1646cm^-1具有光谱最大值(标记的)，比典型α螺旋低，移动10cm^-1并变宽，这是典型的卷曲螺旋蛋白的特征(Heimburg等人，1999)。

图2.SDS洗涤过的蜜蜂巢房(brood comb)丝氨基酸组成与Xenospira蛋白(即，Xenospira 1、Xenospira 2、Xenospira 3、Xenospira 4)(等摩尔数总计65％)及Xenosin氨基酸(35％)组成的比较。

图3.丝氨基酸组成与丝基因编码蛋白预测的氨基酸组成的比较。

图4.蜜蜂丝蛋白卷曲螺旋区的预测。COILS是将一个序列与已知平行双股卷曲螺旋数据库比较的程序，并取得相似性得分。通过将该得分与球形和卷曲螺旋蛋白得分的分布相比较，程序计算该序列采取卷曲螺旋构象的概率，如Lupas等人所述(1991)。使用窗口大小28，本程序预测下列每个蛋白的卷曲螺旋结构域中存在下述残基数目：Xenospira 3：77；Xenospira 4：35；Xenospira 1：28；Xenospira2：80。

图5.蜜蜂丝蛋白比对显示形成卷曲螺旋的主要七肽的MARCOIL预测结果。七肽序列显示在氨基酸上面，a位和d位的丙氨酸残基突出显示。

图6.Marciol预测的膜翅目昆虫(蜜蜂和蚂蚁)丝蛋白卷曲螺旋区比对显示七肽位置分配。Amel，蜜蜂；BB，熊蜂；BA，牛头犬蚁；WA，织工蚁；F1-4，丝心蛋白1-4。七肽序列显示在氨基酸上面，a位、d位和e位的丙氨酸残基突出显示。

图7.玛草蛉(Mallada signata)幼虫丝蛋白和膜翅目昆虫丝蛋白直系同源簇(orthologous clusters)的预测的卷曲螺旋区中七肽位置的氨基酸特征。

图8.晚末龄幼虫唾液腺蛋白的SDS聚丙烯酰胺凝胶电泳。在胰蛋白酶切后分析质谱数据组对蛋白进行鉴定。通过安捷伦公司Spectrum Mill软件将质谱数据与从cDNA序列确定蛋白的预测蛋白序列相匹配，从而得到质谱分析结果。该软件对实验观察到的肽片段数据组与根据已有数据库中蛋白序列产生的可能的预测片段之间的每个匹配的质量给出得分。此处显示的所有序列匹配的Spectrum Mill软件得分都大于20，而20的得分足以自动的有把握的认定一个有效的匹配。

图9.丝蛋白卷曲螺旋区简约性分析。四个卷曲螺旋蛋白的相关性暗示该基因在真针尾类(Euaculeata)分化之前从共同的祖先进化而来。虚线包围的区域显示在侏罗纪晚期蚂蚁和蜜蜂(胡蜂总科)从蜜蜂(蜜蜂总科)分化之前所出现的变异(155myrs(百万年)；Grimaldi和Engel，2005)。图中给出了做1000次重复抽样(iterations)之后，每个分支的自信自展值(bootstrap values)。

图10.A)对蜜蜂丝胰蛋白酶切产生的肽进行质谱分析，鉴定蜜蜂丝蛋白。阴影表示质谱分析鉴定的肽。此处显示的所有序列匹配的Spectrum Mill软件得分都大于20，而20的得分足以自动的有把握的认定一个有效的匹配。

B)熊蜂、牛头犬蚁、织工蚁和草蜻蛉丝蛋白全长氨基酸序列。

图11.编码蜜蜂、熊蜂、牛头犬蚁、织工蚁和草蜻蛉丝蛋白的开放读码框(Openreading frames)。

图12.编码Xenosin的基因序列。提供了完整编码序列，其中插入了一个内含子(突出显示处)。

图13.丝蛋白在烟草中的表达。对下列来源的蛋白进行蛋白印迹分析(westernblot analysis)，检测带组氨酸标签的蛋白：1.空表达载体转化的大肠杆菌(E.coli)，2.包括AmelF4(Xenospira4)编码区的表达载体转化的大肠杆菌(E.coli)，3.空表达载体转化的烟草，4.包括AmelF4编码区的表达载体转化的烟草。

图14.重组蜜蜂丝蛋白制成的纤维表现出双折射线。生物折射表明线中存在结构。A-D每组显示了不同的重组蜜蜂的线，E组中显示了重组的草蜻蛉的线。

序列表索引

SEQ ID NO：1-此处称为Xenospiral的蜜蜂丝蛋白(也称为AmelF1)(减去信号肽)。

SEQ ID NO：2-此处称为Xenospiral的蜜蜂丝蛋白。

SEQ ID NO：3-此处称为Xenospira2的蜜蜂丝蛋白(也称为AmelF2)(减去信号肽)。

SEQ ID NO：4-此处称为Xenospira2的蜜蜂丝蛋白。

SEQ ID NO：5-此处称为Xenospira3的蜜蜂丝蛋白(也称为AmelF3)(减去信号肽)。

SEQ ID NO：6-此处称为Xenospira3的蜜蜂丝蛋白。

SEQ ID NO：7-此处称为Xenospira4的蜜蜂丝蛋白(也称为AmelF4)(减去信号肽)。

SEQ ID NO：8-此处称为Xenospira4的蜜蜂丝蛋白。

SEQ ID NO：9-此处称为Xenosin的蜜蜂丝蛋白(也称为AmelSA1)(减去信号肽)。

SEQ ID NO：10-此处称为Xenosin的蜜蜂丝蛋白。

SEQ ID NO：11-编码蜜蜂丝蛋白Xenospira1的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：12-编码蜜蜂丝蛋白Xenospira1的核苷酸序列。

SEQ ID NO：13-编码蜜蜂丝蛋白Xenospira2的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：14-编码蜜蜂丝蛋白Xenospira2的核苷酸序列。

SEQ ID NO：15-编码蜜蜂丝蛋白Xenospira3的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：16-编码蜜蜂丝蛋白Xenospira3的核苷酸序列。

SEQ ID NO：17-编码蜜蜂丝蛋白Xenospira4的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：18-编码蜜蜂丝蛋白Xenospira4的核苷酸序列。

SEQ ID NO：19-编码蜜蜂丝蛋白Xenosin的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：20-编码蜜蜂丝蛋白Xenosin的核苷酸序列。

SEQ ID NO：21-编码蜜蜂丝蛋白Xenosin的基因序列。

SEQ ID NO：22-此处称为BBF1的熊蜂丝蛋白(减去信号肽)。

SEQ ID NO：23-此处称为BBF1的熊蜂丝蛋白。

SEQ ID NO：24-此处称为BBF2的熊蜂丝蛋白(减去信号肽)。

SEQ ID NO：25-此处称为BBF2的熊蜂丝蛋白。

SEQ ID NO：26-此处称为BBF3的熊蜂丝蛋白(减去信号肽)。

SEQ ID NO：27-此处称为BBF3的熊蜂丝蛋白。

SEQ ID NO：28-此处称为BBF4的熊蜂丝蛋白(减去信号肽)。

SEQ ID NO：29-此处称为BBF4的熊蜂丝蛋白。

SEQ ID NO：30-此处称为BBSA1的熊蜂丝蛋白部分氨基酸序列。

SEQ ID NO：31-编码熊蜂丝蛋白BBF1的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：32-编码熊蜂丝蛋白BBF1的核苷酸序列。

SEQ ID NO：33-编码熊蜂丝蛋白BBF2的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：34-编码熊蜂丝蛋白BBF2的核苷酸序列。

SEQ ID NO：35-编码熊蜂丝蛋白BBF3的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：36-编码熊蜂丝蛋白BBF3的核苷酸序列。

SEQ ID NO：37-编码熊蜂丝蛋白BBF4的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：38-编码熊蜂丝蛋白BBF4的核苷酸序列。

SEQ ID NO：39-编码熊蜂丝蛋白BBSA1的部分核苷酸序列。

SEQ ID NO：40-此处称为BAF1的牛头犬蚁丝蛋白(减去信号肽)。

SEQ ID NO：41-此处称为BAF1的牛头犬蚁丝蛋白。

SEQ ID NO：42-此处称为BAF2的牛头犬蚁丝蛋白(减去信号肽)。

SEQ ID NO：43-此处称为BAF2的牛头犬蚁丝蛋白。

SEQ ID NO：44-此处称为BAF3的牛头犬蚁丝蛋白(减去信号肽)。

SEQ ID NO：45-此处称为BAF3的牛头犬蚁丝蛋白。

SEQ ID NO：46-此处称为BAF4的牛头犬蚁丝蛋白(减去信号肽)。

SEQ ID NO：47-此处称为BAF4的牛头犬蚁丝蛋白。

SEQ ID NO：48-编码牛头犬蚁丝蛋白BAF1的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：49-编码牛头犬蚁丝蛋白BAF1的核苷酸序列。

SEQ ID NO：50-编码牛头犬蚁丝蛋白BAF2的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：51-编码牛头犬蚁丝蛋白BAF2的核苷酸序列。

SEQ ID NO：52-编码牛头犬蚁丝蛋白BAF3的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：53-编码牛头犬蚁丝蛋白BAF3的核苷酸序列。

SEQ ID NO：54-编码牛头犬蚁丝蛋白BAF4的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：55-编码牛头犬蚁丝蛋白BAF4的核苷酸序列。

SEQ ID NO：56-此处称为GAF1的织工蚁丝蛋白(减去信号肽)。

SEQ ID NO：57-此处称为GAF1的织工蚁丝蛋白。

SEQ ID NO：58-此处称为GAF2的织工蚁丝蛋白(减去信号肽)。

SEQ ID NO：59-此处称为GAF2的织工蚁丝蛋白。

SEQ ID NO：60-此处称为GAF3的织工蚁丝蛋白(减去信号肽)。

SEQ ID NO：61-此处称为GAF3的织工蚁丝蛋白。

SEQ ID NO：62-此处称为GAF4的织工蚁丝蛋白(减去信号肽)。

SEQ ID NO：63-此处称为GAF4的织工蚁丝蛋白。

SEQ ID NO：64-编码织工蚁丝蛋白GAF1的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：65-编码织工蚁丝蛋白GAF1的核苷酸序列。

SEQ ID NO：66-编码织工蚁丝蛋白GAF2的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：67-编码织工蚁丝蛋白GAF2的核苷酸序列。

SEQ ID NO：68-编码织工蚁丝蛋白GAF3的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：69-编码织工蚁丝蛋白GAF3的核苷酸序列。

SEQ ID NO：70-编码织工蚁丝蛋白GAF4的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：71-编码织工蚁丝蛋白GAF4的核苷酸序列。

SEQ ID NO：72-此处称为MalF1的草蜻蛉丝蛋白(减去信号肽)。

SEQ ID NO：73-此处称为MalF1的草蜻蛉丝蛋白。

SEQ ID NO：74-编码草蜻蛉丝蛋白MalF1的核苷酸序列(减去编码信号肽的区)。

SEQ ID NO：75-编码草蜻蛉丝蛋白MalF1的核苷酸序列。

SEQ ID NO：76-对密码子为植物表达而进行优化(在亚克隆到pET14b和pVEC8之前)的编码此处称为Xenospira4蜜蜂丝蛋白核苷酸序列。

SEQ ID NO：77-为植物表达而进行优化的蜜蜂丝蛋白(Xenospira4)开放读码框(无翻译融合)。

发明内容

普通技术和定义

除非另有特别定义，此处使用的所有科技术语应与本领域(例如细胞培养、分子遗传学、免疫学、免疫组化、蛋白质化学和生物化学领域)普通技术人员通常理解的意思相同。

除非另有说明，本发明使用的重组蛋白、细胞培养和免疫技术采用标准操作，是本领域技术人员熟知的。这些技术在下列文献中有描述和解释，如：J.Perbal，A Practical Guide to Molecular Cloning(实用分子克隆指南)，John Wiley和Sons(1984)、J.Sambrook等人，Molecular Cloning：ALaboratory Manual(分子克隆：实验指南)，Cold Spring Harbour Laboratory Press(1989)、T.A.Brown(编辑)，Essential Molecular Biology：A Practical Approach(基本分子生物学：实用方法)，第1和第2卷，IRL Press(1991)、D.M.Glover和B.D.Hames(编辑)，DNA Cloning：A Practical Approach(DNA克隆：实用方法)，1-4卷，IRL Press(1995和1996)以及F.M.Ausubel等人(编辑)，Current Protocols in Molecular Biology(现代分子生物学实验方案)，Greene Pub.Associates和Wiley-Interscience(1988，包括至今所有的更新)、Ed Harlow和David Lane(编辑)，Antibodies：A Laboratory Manual(抗体：实验指南)，Cold Spring Harbour Laboratory(1988)和J.E.Coligan等人(编辑)Current Protocols in Immunology(现代免疫学实验方案)，John Wiley&Sons(包括至今所有的更新)，这些文献通过引用合并于此。

此处所用的术语“丝蛋白”和“丝多肽”是指能用来生产丝纤维和/或纤维状蛋白复合体的纤维状蛋白质/多肽。自然存在的丝蛋白诸如蜜蜂等昆虫的巢房(brood comb)丝是本发明的一部分，然而，如此处所述，如果在合适的昆虫中表达，可执行同样功能的这些蛋白质的变体很容易生产出来。

此处所用的“丝纤维”是指包括本发明蛋白质可被织成不同物品如纺织品的丝。

此处所用的“共聚物”是指包括两种或两种以上本发明丝蛋白的组合物。该术语不包括自然存在的如昆虫巢房之类的共聚物。

术语“植物”包括整个植物、营养结构(例如叶、茎)、根、花器官/结构、种子(包括胚、胚乳和种皮)、植物组织(例如维管组织、基本组织之类)、细胞以及同类的子代。

“转基因植物”是指包括未在同种、变种或栽培品种的野生型植物中发现的基因构建物(“转基因”)的植物。此处所指“转基因”与生物技术领域正常的意思相同，包括通过重组DNA或RNA技术产生的或改变的基因序列，并被引入植物细胞。转基因可包括从植物细胞中获得的序列。典型地，该转基因通过诸如转化之类的人工操作引入植物中，但是该操作可以是任何所属领域技术人员认可的方法。

“多核苷酸”是指寡核苷酸、核酸分子或其任何片段。可以是基因组来源或合成的DNA或RNA，可以是双链或单链的，可以结合糖类、脂质、蛋白质或其他材料来行使此处限定的特定功能。

此处所用的“可操作的连接”是指两个或两个以上的核酸(例如DNA)片段之间的功能关系。典型地，是指转录调节元件对所转录的序列之间的功能关系。例如，如果启动子在适当的宿主细胞中促进或调节编码序列的转录，则启动子与编码序列之间是可操作的连接，该编码序列可以是如此处所限定的多核苷酸之类的序列。一般而言，可操作的连接到转录序列的启动子转录调节元件与所转录的序列是实体上连续的，即它们是顺式作用(cis-acting)。然而，有些转录调节元件，如增强子，不必与它们所增强转录的编码序列在实体上连续或位于其附近。

术语“信号肽”是指成熟的分泌蛋白质之前的氨基术端多肽。信号肽从蛋白质中切除，因而并不出现在成熟蛋白质中。信号肽具有指导和反式定位(trans-locating)分泌蛋白质穿过细胞膜的功能。信号肽也称为信号序列。

此处所用的“转化”是指细胞通过包括新的多核苷酸而获得新的基因。

此处所用术语“药物”是指能被用来治疗或预防特定疾病的任何化合物，可通过本发明的丝蛋白制成的药物的例子包括但不限于蛋白质、核酸、抗肿瘤试剂、镇痛药、抗生素、抗炎化合物(类固醇类和非类固醇类都包括)、激素、疫苗、标记物质等等。

多肽

本发明所述“基本上纯化的多肽”意思是指一般的从脂质、核酸、其他多肽和其他污染分子诸如天然状态下结合的蜡中分离的多肽。所述的基本上纯化的多肽优选地至少60％的游离，更优选地至少75％的游离，更优选地至少90％的游离于其天然结合的其他成分，上述限定不包括本发明的其他蛋白。

在多肽的背景中使用的术语“重组”是指细胞或无细胞表达系统中，与其天然状态相比，通过改变产量或产率而产生多肽。在一个实施方式中，所述的细胞是天然不产生该多肽的细胞。然而，所述的细胞可以是包括导致该多肽产量改变，优选地为增加该多肽产量的非内源基因的细胞。本发明的重组多肽包括尚未从产生它的转基因(重组)细胞或无细胞表达系统的其他成分中分离出来的多肽，以及在上述细胞或无细胞系统中产生而后从至少一些其他成分中纯化出来的多肽。

术语“多肽”和“蛋白质”一般可相互替换的使用，是指单多肽链，其可能通过添加非氨基酸基团而修饰，也可能不修饰。此处所用的术语“蛋白质”和“多肽”也包括此处所述的本发明的多肽的变异体、突变体、修饰物、模拟物和/或衍生物。

多肽的％同源性(也称同一性，identity)通过GAP(Needleman和Wunsch，1970)分析(GCG程序)确定，其缺口产生罚分(gap creation penalty)＝5，缺口延伸罚分(gap extension penalty)＝0.3。查询序列至少15个氨基酸长，GAP分析在至少15个氨基酸的区域比对两条序列。更优选地，查询序列至少50个氨基酸长，GAP分析在至少50个氨基酸的区域比对两条序列。更优选地，查询序列至少100个氨基酸长，GAP分析在至少100个氨基酸的区域比对两条序列。更优选地，查询序列至少250个氨基酸长，GAP分析在至少250个氨基酸的区域比对两条序列。更优选地，GAP分析对两条序列的全长进行比对。

此处所用“生物活性”片段是指本发明多肽的一部分，其保持了该全长多肽的确定的活性，即用来产生丝的能力。生物活性片段可为任意长度，只要它们保持了所述的确定的活性。

对于所限定的多肽，应理解比上述％同源性高的数值包括了优选的实施方式。因此，在适用的情况下，根据最低％同源性数值，所述的多肽包括的氨基酸序列，与相应的指定SEQ ID NO具有下述同源性：优选地至少40％，更优选地至少45％，更优选地至少50％，更优选地至少55％，更优选地至少60％，更优选地至少65％，更优选地至少70％，更优选地至少75％，更优选地至少80％，更优选地至少85％，更优选地至少90％，更优选地至少91％，更优选地至少92％，更优选地至少93％，更优选地至少94％，更优选地至少95％，更优选地至少96％，更优选地至少97％，更优选地至少98％，更优选地至少99％，更优选地至少99.1％，更优选地至少99.2％，更优选地至少99.3％，更优选地至少99.4％，更优选地至少99.5％，更优选地至少99.6％，更优选地至少99.7％，更优选地至少99.8％，更优选地至少99.9％。

本发明多肽的氨基酸序列突变体可通过向本发明的核酸中引入适当的改变的核苷酸而制备，或通过体外合成所需的多肽。所述的突变体包括，例如在氨基酸序列内进行残基的删除、插入或替换。可组合运用删除、插入和替换来获得最终的构建物，只要最终的多肽产物具有所需的特性。

突变(改变的)多肽可通过本领域已知的任何技术制备。例如，可对本发明的多核苷酸进行体外诱变。所述的体外诱变技术包括将该多核苷酸亚克隆到适当的载体，转化该载体到“突变”株如大肠杆菌XL-1红(Stratagene)，并使转化的细菌繁殖适当的世代。另一个例子中，对本发明的多核苷酸使用DNA穿梭技术，该技术已被Harayama明白的描述(1998)。这些DNA穿梭技术可包括本发明的基因，并可能还有与本发明基因相关的基因，如来源于此处所述具体物种之外的其他膜翅目和脉翅目物种的丝基因。突变/改变的DNA获得的产物可通过此处描述的技术容易得筛选确定它们能否用作丝蛋白。

在涉及氨基酸序列突变体过程中，突变位点的位置和突变的性质依赖于将要修饰的性状。可对突变的位点进行单个修饰，或进行一系列修饰，例如通过(1)首先进行保守氨基酸替换，然后根据获得的结果进行更激进的替换，(2)删除目标残基，或(3)在该位点附近插入其他残基。

删除的氨基酸序列一般在约1到15个残基的范围内，更优选地约1到10个残基，典型地约1到5个连续残基。

替换突变中该多肽分子去除至少一个氨基酸残基并在该位置插入一个不同残基。最感兴趣的替换诱变位点包括已鉴定为重要的功能位点。其他感兴趣的位点是那些不同株或物种中特定残基相同的位点。这些位点可能对于生物活性是重要的。对这些位点，尤其是至少三个其他完全相同的保守位点，优选地通过一种相对保守的方式进行替换。这些保守的替换列在标题为“典型的替换”的表1中。

如上所述，一些本发明多肽的一部分具有卷曲螺旋结构，多肽的卷曲螺旋结构特征为七肽重复，以一致序列(abcdefg)_n表示。在一个优选的实施方式中，该多肽具有卷曲螺旋结构的部分包括至少10拷贝的七肽序列abcdefg，并且至少25％的a和d为氨基酸为丙氨酸残基。

表1.典型的替换

原残基	典型的替换
原残基	典型的替换	Ala(A)	val；leu；ile；gly；cys；ser；thr
Arg(R)	lys	Ala(A)	val；leu；ile；gly；cys；ser；thr
Arg(R)	lys	Asn(N)	gln；his
Asp(D)	glu	Asn(N)	gln；his
Asp(D)	glu	Cys(C)	Ser；thr；ala；gly；val
Gln(Q)	asn；his	Cys(C)	Ser；thr；ala；gly；val
Gln(Q)	asn；his	Glu(E)	asp
Gly(G)	pro；ala；ser；val；thr	Glu(E)	asp
Gly(G)	pro；ala；ser；val；thr	His(H)	asn；gln
Ile(I)	leu；val；ala；met	His(H)	asn；gln
Ile(I)	leu；val；ala；met	Leu(L)	ile；val；met；ala；phe
Lys(K)	arg	Leu(L)	ile；val；met；ala；phe
Lys(K)	arg	Met(M)	leu；phe
Phe(F)	leu；val；ala	Met(M)	leu；phe
Phe(F)	leu；val；ala	Pro(P)	gly
Ser(S)	thr；ala；gly；val；gln	Pro(P)	gly
Ser(S)	thr；ala；gly；val；gln	Thr(T)	ser；gln；ala
Trp(W)	tyr	Thr(T)	ser；gln；ala
Trp(W)	tyr	Tyr(Y)	trp；phe
Val(V)	ile；leu；met；phe；ala；ser；thr	Tyr(Y)	trp；phe

在一个优选的实施方式中，具有卷曲螺旋结构的多肽包括至少12个连续拷贝，更优选地至少15个连续拷贝，更优选地至少18个连续拷贝的七肽。进一步的实施方式中，所述的具有卷曲螺旋结构的多肽含有达到至少28拷贝的七肽。典型地，该七肽的拷贝是串联重复的(tandemly repeated)。然而，它们不一定必须是精确的串联重复，例如，如图5和图6所示，可能在两个七肽间发现一些氨基酸，或可能发现一些截断的七肽(例如，见图5中Xenospiral)。

图5和图6以及表6-10提供了对具有卷曲螺旋结构的本发明多肽可进行的氨基酸替换的指南。当此处提供的基于实验数据的预测有用的氨基酸替换与表1提供的典型的替换有任何形式的冲突时，优选地使用基于实验数据的替换。

本发明多肽的卷曲螺旋结构具有高丙氨酸残基含量，特别是在七肽的a、d和e氨基酸位。然而，b、c、f和g位也有高频率的丙氨酸残基。在一个优选实施方式中，至少15％的七肽的a、d和/或e位氨基酸是丙氨酸残基是丙氨酸残基，更优选地至少25％，更优选地至少30％，更优选地至少40％，更优选地至少50％。在进一步的优选实施方式中，至少25％的七肽的a和d位氨基酸都是丙氨酸残基，更优选地至少30％，更优选地至少40％，更优选地至少50％。此外，优选地至少15％的七肽b、c、f和g位氨基酸是丙氨酸残基，更优选地至少20％，更优选地至少25％。

典型地，该七肽不包括脯氨酸或组氨酸残基。而且，该七肽中，下列残基如果有，也是很少的(1或2个)，这些残基为苯丙氨酸、甲硫氨酸、酪氨酸、半胱氨酸、甘氨酸或色氨酸残基。除了丙氨酸，该七肽中通常的(例如，多于5％，更优选地多于10％)氨基酸包括亮氨酸(特别是在b和d位)、丝氨酸(特别是在b、e和f位)、谷氨酸(特别是在c、e和f位)、赖氨酸(特别是在b、c、d、f和g位)，以及g位的精氨酸。

本发明的多肽(和多核苷酸)可从广泛的膜翅目和脉翅目昆虫物种中纯化(分离)获得。膜翅目昆虫的例子包括但不限于细腰(Apocrita)亚目的任何种(蜜蜂、蚂蚁和黄蜂)，其包括下列各科昆虫：青蜂科(Chrysididae)(青蜂，cuckoo wasps)、蚁科(Formicidae)(蚂蚁，ants)、蚁蜂科(Mutillidae)(蚁蜂，velvet ants)、蛛蜂科(Pompilidae)(蛛蜂，spider wasps)、土蜂科(Scoliidae)、胡蜂科(Vespidae)(黄蜂，paper wasps、蜾蠃potter wasps、虎头蜂hornets)、榕小蜂科(Agaonidae)(榕小蜂，fig wasps)、小蜂科(Chalcididae)(小蜂，chalcidids)、蚁小蜂科(Eucharitidae)(蚁小蜂，eucharitids)、旋小蜂科(Eupelmidae)(旋小蜂，eupelmids)、金小蜂科(Pteromalidae)(金小蜂，pteromalids)、旗腹姬蜂科(Evaniidae)(瘦蜂，ensign wasps)、茧蜂科(Braconidae)、姬蜂科(Ichneumonidae)(姬蜂，ichneumons)、切叶峰科(Megachilidae)、蜜蜂科(Apidae)、分舌花蜂科(Colletidae)、集蜂科(Halictidae)和准蜜蜂科(Melittidae)(集油蜜蜂，oil collectingbees)。脉翅目昆虫的例子包括下列各科昆虫的种：螳蛉科(Mantispidae)、草蛉科(Chrysopidae)(草蜻蛉，lacewings)、蚁蛉科(Myrmeleontidae)(蚁狮antlions)和蝶角蛉科(Ascalaphidae)(枭蝇，owlflies)。这类更多的多肽(和多核苷酸)可用此处描述的同样程序从来源于授粉熊蜂(Bombus terrestris)、牛头犬蚁(Myrmeciaforficata)、黄猄蚁(Oecophylla smaragdina)和玛草蛉(Mallada signata)的丝中鉴定其特性。

此外，如果需要，非自然存在的氨基酸或化学氨基酸类似物可通过替代或加入而引入本发明的多肽中。这些氨基酸包括但不限于一般氨基酸的右旋体、2，4-二氨基丁酸、α-氨基异丁酸、4-氨基丁酸、2-氨基丁酸、6-氨基己酸、2-氨基异丁酸、3-氨基丙酸、鸟氨酸、正亮氨酸、正缬氨酸、羟脯氨酸、肌氨酸、瓜氨酸、高瓜氨酸、磺丙氨酸、叔丁基甘氨酸、叔丁基丙氨酸、苯基甘氨酸、丙氨酸环己酯、β-丙氨酸、氟氨基酸、设计的氨基酸如β-甲基氨基酸、Cα-甲基氨基酸、Nα-甲基氨基酸以及一般的氨基酸类似物。

本发明的范围内也包括在合成过程中或合成后进行不同修饰的本发明多肽，例如，生物素化、苄基化、糖基化、乙酰化、磷酸化、酰胺化、已知保护/封闭基团衍生化、蛋白水解性裂解、结合抗体分子或其他细胞配基等。这些修饰可能起到增强本发明多肽的稳定性和/或生物活性的作用。

本发明多肽可通过许多方法生产，包括自然多肽的生产和回收、重组多肽的生产和回收以及化学合成这些多肽。在一个实施方式中，分离的本发明多肽通过在有效产生该多肽的条件下培养能够表达所述的多肽的细胞，并回收该多肽而获得。优选的要培养的细胞为本发明的重组细胞。有效的培养条件包括但不限于允许多肽生产的有效的培养基、生物反应器、温度、pH和氧气条件。有效的培养基是指用来培养产生本发明多肽细胞的任何培养基。该培养基典型地包括含有可同化碳、氮和磷酸盐来源，以及适当的盐、矿物质、金属和其他营养素如维生素的水性培养基。本发明的细胞可通过传统的发酵生物反应器、摇瓶、试管、微量滴定盘以及培养皿中培养。培养可在适合重组细胞的温度、pH和氧气环境中进行。该培养条件在本领域普通技术人员的技术范围内。

多核苷酸

所述的“分离的多核苷酸”，包括DNA、RNA或其组合、单链或双链、正义链或反义链方向或其组合、dsRNA或其他，是指至少部分地从它天然状态下结合或连接的多核苷酸序列中分离出来的多核苷酸序列。优选地，分离的多核苷酸至少60％游离、优选地至少75％游离、最优选地至少90％游离于它们自然状态下结合的其他成分。此外，此处使用的术语“多核苷酸”与术语“核酸”可相互替换。

在多核苷酸语境中使用的术语“外源的”是指与其天然状态相比以一种数量发生改变的方式出现在细胞或无细胞表达系统中。在一个实施方式中，所述的细胞是在天然状态下不包括该多核苷酸的细胞。然而，所述的细胞可以是包括导致其编码多肽的产量发生改变，优选的为增加的非外源多核苷酸的细胞。本发明的外源多核苷酸包括尚未从存在该多核苷酸的转基因(重组)细胞或无细胞表达系统的其他成分中分离出来的多核苷酸，以及在上述细胞或无细胞系统中产生而后从至少一些其他成分中纯化出来的多核苷酸。

多核苷酸的％同源性(identity)通过GAP(Needleman和Wunsch，1970)分析(GCG程序)确定，其缺口产生罚分(gap creationpenalty)＝5，缺口延伸罚分(gap extensionpenalty)＝0.3。除非另有说明，查询序列至少45个核苷酸长，GAP分析在至少45个核苷酸的区域比对两条序列。优选地，查询序列至少150个核苷酸长，GAP分析在至少150个核苷酸的区域比对两条序列。更优选地，查询序列至少300个核苷酸长，GAP分析在至少300个核苷酸的区域比对两条序列。更优选地，GAP分析对两条序列的全长进行比对。

对于所限定的多核苷酸，应理解比上述％同源性高的数值包括了优选的实施方式。因此，在适用的情况下，根据最低％同源性数值，所述的多核苷酸包括的序列，与相应的指定SEQ ID NO具有下述同源性：优选地至少40％，更优选地至少45％，更优选地至少50％，更优选地至少55％，更优选地至少60％，更优选地至少65％，更优选地至少70％，更优选地至少75％，更优选地至少80％，更优选地至少85％，更优选地至少90％，更优选地至少91％，更优选地至少92％，更优选地至少93％，更优选地至少94％，更优选地至少95％，更优选地至少96％，更优选地至少97％，更优选地至少98％，更优选地至少99％，更优选地至少99.1％，更优选地至少99.2％，更优选地至少99.3％，更优选地至少99.4％，更优选地至少99.5％，更优选地至少99.6％，更优选地至少99.7％，更优选地至少99.8％，更优选地至少99.9％。

本发明的多核苷酸可包括与天然存在的分子相比具有一个或一个以上的核苷酸残基缺失、插入或替换的突变。突变体可以是自然发生的(即，从自然来源分离的)，也可以是合成的(例如，在该核酸上进行定向诱变)。

本发明的寡核苷酸和/或多核苷酸在严谨的条件下与本发明的丝基因或所述的基因的侧翼区杂交。此处所用的术语“严谨的杂交条件”等是指本领域熟悉的参数，包括随寡核苷酸长度改变杂交温度。核酸杂交参数可在编辑该方法的参考文献中找到，如Sambrook等人(见前述)和Ausubel等人(见前述)。例如，此处所用的严谨的杂交条件，可指在杂交缓冲液(3.5×SSC、0.02％聚蔗糖、0.02％聚乙烯吡咯烷酮、0.02％牛血清白蛋白(BSA)、2.5mM NaH₂PO₄(pH7)、0.5％SDS、2mM EDTA)中65℃杂交，然后在50℃0.2×SSC，0.01％BSA中洗一次或一次以上。另外，核酸和/或寡核苷酸(也可称为“引物”或“探针”)在核酸扩增技术如PCR中使用的条件下与感兴趣的昆虫基因组区杂交，如蜜蜂的基因组。

本发明的寡核苷酸可为RNA、DNA或其衍生物。尽管术语多核苷酸和寡核苷酸的意思有重叠的地方，寡核苷酸典型地是指相对短的单链分子。该寡核苷酸的最小值为寡核苷酸与目标核酸分子上的互补序列形成稳定杂交分子所需的大小。优选地，该寡核苷酸至少有15个核苷酸，更优选地至少有18个核苷酸，更优选地至少有19个核苷酸，更优选地至少有20个核苷酸，更优选地至少有25个核苷酸长度。

一般而言，多核苷酸或寡核苷酸单体通过磷酸二酯键或其类似连接连接形成从相对短的单体单元如12-18个到几百个单体单元大小的寡核苷酸。磷酸二酯键的类似连接包括：磷硫酰、二硫代磷酸酯、磷硒酰(phosphoroselenoate)、二硒代磷酸酯(phosphorodiselenoate)、硫代磷酸苯胺(phosphoroanilothioate)、磷酸苯胺(phosphoranilidate)、氨基磷酸酯(phosphoramidate)。

本发明包括可用于鉴别核酸分子的探针或产生核酸分子的引物之类的寡核苷酸。用作探针的本发明寡核苷酸典型地与放射性同位素、酶、生物素、荧光分子或化学发光分子之类的可检测的标记物相结合。

重组载体

本发明的一个实施方式包括一种重组载体，该重组载体包括至少一种插入到任何能够将本发明多核苷酸传递到宿主细胞的载体中的本发明的分离多核苷酸。所述的载体包括异源多核苷酸序列，即那些并不天然出现在本发明多核苷酸分子附近的多核苷酸序列，并且优选地该多核苷酸序列来源于与本发明多核苷酸序列不同的物种。该载体可为RNA或DNA，原核的或真核的，且典型地为转座子(诸如US 5,792,294中所描述的)、病毒或质粒。

一种类型的重组载体包括可操作的连接到表达载体的本发明的多核苷酸分子。可操作的连接是指将多核苷酸分子以转化入宿主细胞中时该分子能够表达的方式插入到表达载体中。此处所用的表达载体是指能够转化宿主细胞并能够有效表达指定多核苷酸分子的DNA或RNA载体。优选地，该表达载体也能够在宿主细胞内复制。表达载体可为原核的或真核的，典型地为病毒或质粒。本发明的表达载体包括任何在本发明重组细胞中发挥功能(即指导基因表达)的载体，包括在细菌、真菌、内寄生物、节肢动物、动物和植物细胞中。本发明特别优选的表达载体能够在植物细胞中指导基因表达。本发明的载体也能用于在无细胞表达系统中产生多肽，该系统是本领域熟知的。

特别地，本发明的表达载体包括如转录控制序列、翻译控制序列、复制起始点等调节序列，以及其他与重组细胞相容的和控制本发明多核苷酸分子表达的调节序列。特别地，本发明的重组分子包括转录控制序列。转录控制序列是控制转录起始、延伸和终止的序列。特别重要的转录控制序列是控制转录起始的序列，如启动子、增强子、操纵子和阻遏物序列。适当的转录控制序列包括能够在至少一种本发明重组细胞中发挥功能的任何转录控制序列。许多这样的转录控制序列是本领域技术人员已知的。优选的转录控制序列包括在细菌、酵母、节肢动物、植物或哺乳动物细胞中发挥功能的序列，如下所述但并不局限于此：tac、lac、trp、trc、oxy-pro、omp/lpp、rrnB、噬菌体λ、噬菌体T7、T7lac、噬菌体T3、噬菌体SP6、噬菌体SP01、金属硫蛋白、α交配因子、毕赤酵母乙醇氧化酶、α病毒亚基因组启动子(如Sindbis病毒亚基因组启动子)、抗生素抗性基因、杆状病毒、玉米夜蛾昆虫病毒、痘苗病毒、疱疹病毒、浣熊痘病毒、其他痘病毒、腺病毒、巨细胞病毒(如中间体早期启动子)、猿猴病毒40、逆转录病毒、肌动蛋白、逆转录病毒长末端重复、劳氏肉瘤病毒、热休克、磷酸盐和硝酸盐转录控制序列，以及其他能够在原核或真核细胞中控制基因表达的序列。

特别优选的转录控制序列为在植物中有指导转录活性的启动子，可以是组成型的或阶段和/或组织特异性的，取决于所用的植物或植物部分。植物启动子包括但不限于组成型表达的启动子，如花椰菜花叶病毒(CaMV)的35S启动子，叶特异性表达的，如二磷酸核酮糖羧化酶小亚基基因启动子，根特异性表达的，如谷氨酰胺合酶基因启动子，种子特异性表达的，如甘蓝型油菜cruciferin A基因启动子，块茎特异性表达的，如马铃薯I类patatin基因启动子，以及果实特异性表达的，如番茄的多聚半乳糖醛酸酶(PG)启动子。

本发明的重组分子也可包括(a)分泌信号(即信号片段核酸序列)，以使本发明的表达多肽从产生该多肽的细胞分泌出来和/或(b)融合序列，以便以融合蛋白的形式表达本发明的核酸分子。信号片段的例子包括能够指导本发明多肽分泌的任何信号片段。优选的信号片段包括但不限于组织纤维蛋白溶酶原激活物(t-PA)、干扰素、白介素、生长激素、病毒被膜糖蛋白信号片段、Nicotiana nectarin信号肽(US 5,939,288)、烟草伸展蛋白信号、大豆油质蛋白油体结合蛋白信号、拟南芥液泡碱性几丁质酶信号肽，以及本发明多肽的天然信号序列。此外，本发明核酸分子可连接到指导所编码的多肽到蛋白体(proteosome)的融合片段上，如泛素融合片段。重组分子也可包括本发明核酸序列周围和/或内部插入的和/或非翻译序列。

宿主细胞

本发明另外一个实施方式包括一种重组细胞，该重组细胞包括一种或一种以上本发明重组分子转化的宿主细胞，或其子代细胞。可通过任何能够将多核苷酸分子插入细胞中的方法将多核苷酸分子转化进入细胞。转化技术包括但不限于转染、电穿孔、显微注射、脂质转染、吸附和原生质融合。重组细胞可保持为单细胞或长成组织、器官或多细胞生物体。转化的本发明多核苷酸分子可保持在染色体外，也可以保留表达能力的方式整合到被转化(即重组)细胞染色体上的一个或一个以上的位点。

适当的将要进行转化的宿主细胞包括任何能用本发明多核苷酸转化的细胞。本发明宿主细胞可为能够产生本发明多肽的内源的(即天然的)细胞，也可为通过至少一种本发明多核苷酸分子转化后能够产生所述的多肽的细胞。本发明的宿主细胞可为任何能够产生至少一种本发明蛋白质的细胞，包括细菌、真菌(包括酵母)、寄生虫、节肢动物、动物和植物细胞。宿主细胞的例子包括沙门氏菌、埃希菌属、杆菌、李斯特菌属、酵母、夜蛾(Spodoptera)、分枝杆菌、Trichoplusia、BHK(幼仓鼠肾)细胞、MDCK细胞、CRFK细胞、CV-1胞、COS(例如COS-7)细胞和Vero细胞。更多的宿主细胞例子如大肠杆菌，包括大肠杆菌K-12衍生物；伤寒沙门氏菌；鼠伤寒沙门氏菌，包括减毒菌株；贪食夜蛾；粉纹夜蛾；以及非致瘤性小鼠生肌G8细胞(例如ATCC CRL 1246)。其他适当的哺乳动物宿主细胞包括其他肾细胞系、其他成纤维细胞系(如人、鼠、鸡胚成纤维细胞系)骨髓瘤细胞系、中国仓鼠卵巢细胞、小鼠NIH/3T3细胞、LMTK细胞和/或HeLa细胞。特别优选的宿主细胞是可从Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH(德国微生物和细胞培养物收藏所)等处获得的植物细胞。

重组DNA技术可用来改善转化的多核苷酸分子的表达，通过操作如宿主细胞内多核苷酸分子的拷贝数，多核苷酸分子转录的效率、产生的转录本翻译的效率，以及翻译后修饰的效率等。可用于提高本发明多核苷酸分子表达的重组技术包括但不限于多核苷酸分子可操作的连接到高拷贝数的质粒、多核苷酸分子整合到一个或一个以上的宿主细胞染色体中、向质粒中加入载体稳定性序列、替换或修饰转录控制信号(如启动子、操纵子、增强子)、替换或修饰翻译控制信号(如核糖体结合位点，Shine-Dalgarno序列)、修饰本发明多核苷酸分子以符合宿主细胞使用的密码子，以及删除使转录本不稳定的序列。

转基因植物

术语“植物”是指整株植物、植物器官(如叶、茎、根等)、种子、植物细胞等等。本发明使用的植物包括单子叶植物和双子叶植物。目标植物包括但不限于下列植物：谷类(小麦、大麦、黑麦、燕麦、稻、高粱和相关作物)；甜菜属(甜菜和饲用甜菜)；梨果、核果和软果(苹果、梨、李子、桃、扁桃、樱桃、草莓、覆盆子和黑莓)；豆科植物(豆类、扁豆、豌豆、大豆)；油类植物(油菜、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油类植物、可可豆、落花生)；黄瓜植物(marrows、黄瓜、瓜类)；纤维植物(棉花、亚麻、大麻、黄麻)；柑橘类水果(橙、柠檬、葡萄柚、蜜桔)；蔬菜(菠菜、莴苣、芦笋、卷心菜、胡萝卜、洋葱、番茄、马铃薯、红辣椒)；樟科(酪梨、肉桂、樟脑)；或如玉米、烟草、坚果、咖啡、甘蔗、茶、藤、蛇麻花、草、香蕉和天然橡胶之类的植物，以及观赏植物(花、灌木、阔叶树和常绿植物如松柏类植物)。

本发明文中限定的转基因植物包括植物(即所述植物的部分和细胞)及其子代，其子代通过使用重组技术进行基因修饰，以在所需的植物或植物器官中产生至少一种本发明的多肽。转基因植物可通过本领域已知的技术产生，如A.Slater等人在Plant Biotechnology-The Genetic Manipulation of Plants(植物生物技术——植物基因操作)，(Oxford University Press(2003))，以及P.Christou和H.Klee在Handbook of Plant Biotechnology(植物生物技术手册)，John Wiley and Sons(2004))中广泛描述的。

本发明多核苷酸可在转基因植物所有发育阶段组成型表达。根据所用植物或植物器官，所述的多肽可通过阶段特异性的方式表达。此外，所述的多核苷酸可组织特异性的表达。

已知的或发现能够使编码感兴趣多肽的基因在植物中表达的调节序列可用于本发明。对所用调节序列的选择取决于感兴趣的目标植物和/或植物器官。所述的调节序列可取自植物或植物病毒，或可通过化学合成。所述的调节序列是本领域技术人员熟知的。

组成型植物启动子是人们熟知的。除上述提到的启动子外，一些其他适当的启动子包括但不限于胭脂碱合酶启动子、章鱼碱合酶启动子、CaMV 35S启动子、核酮糖-1，5二磷酸羧化酶启动子、Adhl-based pEmu、Actl、SAM合酶启动子、Ubi启动子以及叶绿素a/b结合蛋白启动子。另外可能需要转基因以一种受调节的方式表达。通过将丝蛋白的编码序列置于组织特异性、发育特异性或可诱导启动子的控制下，对多肽调节表达是可能的。已经有一些植物中组织特异性的调节基因和/或启动子的报道。其包括编码种子贮藏蛋白(如napin、cruciferin、β-conglycinin、大豆球蛋白和菜豆球蛋白)、玉米醇溶蛋白或油体蛋白(如油质蛋白)、或涉及脂肪酸生物合成的基因(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad2-1))和其他胚胎发育过程中表达的基因(如Bce4)。对种子特异性表达特别有用的为豌豆球蛋白启动子。其他用于成熟叶中表达的启动子是那些开启衰老起始的启动子，如拟南芥中SAG启动子)。US 4,943,674讨论了一类在开花期或在开花期经过果实发育，至少到开始成熟的过程中果实特异性表达的启动子。其他组织特异性启动子的例子包括在块茎中(如patatin基因启动子)和纤维细胞中(一个受发育调节的纤维细胞蛋白的例子是E6纤维)指导表达的启动子。

其他调节序列如终止子序列和多腺苷酸化信号包括任何在植物中发挥该功能的序列，其选择对于本领域技术人员是显而易见的。由于终止区似乎是相对可相互替换的，因而主要根据方便选择表达盒中使用的终止区。所用的终止区可能是与转录起始区天然配套的、可能是与感兴趣的多核苷酸序列天然配套的或者是来自于其他来源的。终止区可以是天然存在的，也可以是完全或部分合成的。方便的终止区可从农杆菌(A.tumefaciens)Ti质粒中获得，如章鱼碱合酶和胭脂碱合酶终止区，或从β菜豆球蛋白基因、化学诱导的lant基因pIN中获得。

一些技术可用于将包括编码感兴趣的多肽的核酸序列的表达构建物引入目标植物中。该技术包括但不限于用钙/聚乙二醇方法转化原生质体、电穿孔和显微注射或(包被的)粒子轰击。除了这些称为直接DNA转化法之外，涉及载体的转化系统是广泛可得的，如病毒和细菌载体(例如来自于农杆菌属)。在选择和/或筛选后，被转化的原生质体、细胞或植物部分可通过本领域已知的方法再生成整株植物。转化和/或再生技术的选择对本发明来说并不严谨。

为证实转基因存在与转基因细胞和植物中，可通过本领域技术人员已知的方法进行聚合酶链反应(PCR)扩增或Southern印迹分析。可用诸多可用方法中的任何一种检测转基因的表达产物，取决于产物的性质，包括Western印迹和酶鉴定。一种定量蛋白表达及检测不同植物组织中复制的特别有用的方法是应用报告基因，如GUS。获得转基因植物后，可对其进行栽培以产生具有所需表型的植物组织或植物部分。可收割该植物组织或植物部分，和/或采集种子。该种子可作为栽培具有所需性状组织或部分的植物的来源。

非人类转基因动物

产生转基因动物的方法是本领域所熟知的。对这一主题有用的全面的教科书是Houdebine的Transgenic animals-Generation and Use (转基因动物——产生和用途)(Harwood Academic，1997)。

异源DNA可引入如哺乳动物受精卵中。例如，全能或多能干细胞可通过显微注射、磷酸钙沉淀、脂质体融合、逆转录病毒感染或其他方法转化，转化的细胞引入胚胎中，胚胎发育成转基因动物。在高度优选的方法中，用含有所需DNA的逆转录病毒感染发育的胚胎，然后感染的胚胎产生转基因动物。然而，在最优选的方法中，适当的DNA共注射到胚胎的前核或胞质中，优选地在单细胞期，该胚胎发育成成熟的转基因动物。

用来产生转基因动物的另外一种方法涉及使用标准方法将核酸显微注射到前核期卵中，然后在移植到假孕受者的输卵管中之前培养注射的卵。

转基因动物也可通过核移植技术产生。在该方法中，使用包括在调节序列控制下的感兴趣的结合结构域或结合配偶体(binding partner)的编码序列的质粒稳定地转染供者动物的成纤维细胞。然后将稳定的转染子与去核的卵母细胞融合，培养并移植到雌性受者中。

丝的回收方法和生产

本发明的丝蛋白可从重组细胞，如植物、细菌或酵母细胞中提取和纯化，通过多种方法生产所述的蛋白。在一个实施方式中，该方法涉及通过降低pH和加热，然后采用硫酸铵分级分离从同质化(homogenized)的细胞/组织/植物等中去除天然的细胞蛋白。简单的说，通过同质化细胞/组织/植物提取总可溶性蛋白。通过pH 4.7沉淀然后60℃处理去除天然蛋白。产生的上清液用40％饱和度的硫酸铵分级分离。产生的蛋白质将具有95％级的纯度。可通过常规的胶或亲和层析获得进一步的纯化。

在另外一个例子中，使用高浓度的酸，如HCl或丙酸降低pH到～1-2一小时或一小时以上处理细胞裂解物，该处理将使丝蛋白溶解但使其他蛋白沉淀。

当蛋白浓度超过关键值时，本发明丝蛋白通过自发的自组装从溶液中形成纤维状聚集物。可按照O′Brien等人的方法收集该聚集物并将其机械纺织成肉眼可见的纤维(I.O′Brien等人″Design，Synthesis and Fabrication of Novel Self-AssemblingFibrillar Proteins(新的自组装纤维状蛋白质的设计、合成和组装)″，Silk Polymers：Materials Science and Biotechnology，pp.104-117，Kaplan，Adams，Farmer和Viney，eds.，c.1994，American Chemical Society，Washington，D.C)。

根据卷曲螺旋二级结构的固有性质，诸如Xenospira1-4、BBF 1-4、BAF 1-4和GAF 1-4在脱水时会自发形成卷曲螺旋的二级结构。如下所述，可通过对临近赖氨酸进行酶或化学交联增强卷曲螺旋的强度。

本发明的丝纤维和/或共聚物对加工处理的要求不高。本发明的丝蛋白要求最小的加工处理，例如纺织形成强纤维，因为它们自发形成强的卷曲螺旋，并可通过如赖氨酸交联等交联而进一步增强。这与家蚕和蜘蛛的重组丝多肽形成对比，后者需要复杂的纺织技术以获得二级结构(β-片层)和纤维的强度。

然而，纤维可从具有液晶相特征属性的溶液中抽出。能够产生相变的纤维浓度取决于溶液中一种蛋白质的组成或几种蛋白质的组合。相变可通过监测溶液的透明度和双折射来进行检测。当溶液具有半透明的表现并且通过交叉的偏振滤光片观察时记录有双折射时，可检测到液晶相的起始。

在一种形成纤维的技术中，纤维可首先通过一个孔口(orifice)从蛋白溶液中拉出并进入甲醇中，直到产生足够使用机械装置拾起的长度。然后通过该机械装置拉出纤维通过甲醇溶液，收集并干燥。拉拔纤维的方法被认为是本领域熟知的。

US 2004/0170827和US 2005/0054830描述了更多可用来生产本发明丝纤维和/或共聚物的方法的例子。

在一个优选的实施方式中，本发明丝纤维和/或共聚物是交联的。在一个实施方式中，所述的丝纤维和/或共聚物通过本领域已知的方法交联到感兴趣的表面/物品/产品等上。在另一个实施方式中(或与前面的实施方式结合)，丝纤维和/或共聚物中至少一些丝蛋白相互交联。优选地，丝蛋白通过蛋白质中的赖氨酸残基交联。该交联可通过本领域已知的化学和/或酶技术进行。例如酶交联可被赖氨酸氧化酶催化，而非酶交联可通过糖化的赖氨酸残基产生(Reiser等人，1992)。

抗体

本发明也提供本发明多肽或其片段的单克隆或多克隆抗体。因此，本发明进一步提供生产本发明多肽的单克隆或多克隆抗体的方法。

术语“结合特异性”是指抗体结合至少一种本发明多肽而不是其他已知丝蛋白的能力。

此处所用的术语“表位”是指被抗体结合的本发明多肽的区。表位可给予动物以产生抗该表位的抗体，然而，本发明的抗体优选地在整个多肽的环境中特异性的结合表位区。

如果需要多克隆抗体，使用本发明的免疫原性多肽免疫选定的哺乳动物(小鼠、兔、山羊、马等)。根据已知的程序收集和处理免疫动物的血清。如果包括多克隆抗体的血清包括对其他抗原的抗体，该多克隆抗体可通过免疫亲和层析进行纯化。生产和处理多克隆抗血清的技术是本领域已知的。为制造所述的抗体，本发明也提供本发明多肽或其片段作为半抗原连接到另外的多肽用作动物中的免疫原。

本领域技术人员也可以容易地生产抗本发明多肽的单克隆抗体。通过杂交瘤制作单克隆抗体的一般方法是人们熟知的。产生永生抗体的细胞系可通过细胞融合产生，也可通过其他技术如致癌DNA转化B淋巴细胞，或EB病毒(Epstein-Barrvirus)转染。可根据不同的特性筛选单克隆抗体组；即同种型和表位亲和力。

另外一种技术涉及筛选噬菌体展示库，其中，例如噬菌体在其被膜上表达带有大量多种互补决定区(CDRs)的scFV片段。该技术是本领域熟知的。

为本发明的目的，术语“抗体”，除非有相反的说明，包括保留了对目标抗原结合活性的完整抗体片段。所述的片段包括Fv、F(ab′)和F(ab′)₂片段，以及单链抗体(scFv)。此外，抗体及其片段可为人源化抗体，例如EP-A-239400中描述的。

本发明的抗体可结合到固相支持物和/或同适当的试剂、对照、说明书之类的一起装入适当的容器包装到试剂盒中。

优选地，本发明的抗体带有可检测的标记。代表性的允许直接检测抗体结合的可检测标记包括放射性标记、荧光团、染料、磁珠、化学发光基团、胶体颗粒等等。允许直接测量结合的标记的例子包括底物提供有色或荧光产物的酶。另外的代表性可检测的标记包括加入适当底物后能提供可检测产物信号的共价结合的酶。用来结合的适当的酶的例子包括辣根过氧化物酶、碱性磷酸酶、苹果酸脱氢酶等等。若商业上不可获得，所述的抗体-酶结合物可通过本领域技术人员已知的技术容易的生产。更多的代表性的可检测的标记包括对抗生物素蛋白或抗生物素蛋白链菌素有高亲和力的生物素；可与荧光激活细胞分类器一起使用的荧光色素(例如藻胆蛋白、藻红蛋白和别藻蓝蛋白；荧光素和德克萨斯红)；及其类似物质。优选地，可检测标记允许在光度计盘中直接测量，例如生物素。所述的标记抗体可通过本领域已知的方法检测本发明的多肽。

组合物

本发明的组合物可包括“可接受的载体”，该可接受的载体的例子包括水、盐水、任氏液、葡萄糖溶液、Hank′s液，以及其他含水生理平衡盐溶液。也可使用非水性载体，如不挥发油、麻油、油酸乙酯或甘油三酯。

在一个实施方式中，“可接受的载体”是“药学上可接受的载体”。术语药学上可接受的载体是指给予动物，特别是哺乳动物，更特别的是人的时候不产生过敏，毒性或不良反应的分子实体或组合物。有用的药学上可接受的载体或稀释剂的例子包括但不限于不影响本发明多肽活性的溶剂、分散剂、包衣、稳定剂、保护性胶体、粘合剂、增稠剂、摇溶剂、渗透剂、掩蔽剂和等渗和缓释剂。可通过，例如使用包衣，如卵磷脂，在分散时维持所需的粒子大小以及使用表面活性剂来维持适当的流动性。更普遍地，本发明多肽可通过相应的通常使用的配制技术和任何无毒的固体或液体添加剂联合使用。

如此处概括的，在一些实施方式中，本发明的多肽、丝纤维和/或共聚物用作药学上可接受的载体。

下面描述了本发明多肽具体用途的其他适当组合物，具有具体的参考资料。

用途

由于其特别的韧性和强度，丝蛋白可用于创造新的生物材料。然而，至今为止蜘蛛和昆虫的纤维状蛋白质是大蛋白(大于100KDa)，并由高度重复的氨基酸序列组成。这些蛋白质由包括高度偏爱性的密码子的大基因编码，使他们特别难以在重组系统中生产。相比之下，本发明的丝蛋白是短的和非重复的。这些特性使得编码这些蛋白的基因对于通过重组生产新的生物材料特别有吸引力。

本发明的丝蛋白、丝纤维和/或共聚物在医学、军事、工业和商业应用等广泛和多种领域中可以应用。纤维可用于制造医学用具如缝合、植皮、细胞生长基质、置换韧带、外科修补网状织物，以及用于工业和商业产品的广泛领域，如线缆、绳、网、鱼线、衣服织物、防弹背心、容器织物、背包、背囊、袋或钱包带、粘性结合材料、非粘性结合材料、带材料、帐篷织物、帆布、库覆盖物、车辆覆盖物、围墙材料、封闭剂、建筑材料、耐风雨材料、韧性隔离材料、运动器材；以及事实上可用于任何需要高拉伸强度和弹性特性的纤维和织物中。本发明的丝蛋白、丝纤维和/或共聚物也可用于个人护理产品组合物中，如化妆品、皮肤养护、护发和染发中；以及粒子的涂层，如色料。

丝蛋白可用其天然形式或修饰成具有更有益效果的衍生物。例如，丝蛋白可通过结合反应修饰成聚合物以降低变异原型，如US 5,981,718和US 5,856,451所述。适当的修饰聚合物包括但不限于聚烯化氧化物(polyalkylene oxides)、聚乙烯醇(polyvinyl alcohol)、聚羧酸盐(poly-carboxylates)、聚乙烯吡咯烷(poly(vinylpyrolidone))、和葡聚糖(dextrans)。在另外的例子中，丝蛋白的修饰可通过选择性消化和剪切其他蛋白修饰物。例如，丝蛋白可通过提高温度约60℃酸处理切成更小的肽单位。有用的酸包括但不限于稀盐酸、含硫和含磷酸。另外，丝蛋白的消化可通过碱处理完成，如氢氧化钠，或可使用适当的蛋白酶进行酶消化。

所述的蛋白质可通过进一步修饰以提供在个人护理产品中具有有益的特别用途的性能特性。对用于个人护理产品的蛋白修饰是本领域所熟知的。例如，常用的方法在US 6,303,752、US 6,284,246和US 6,358,501中有描述。修饰的例子包括但不限于乙氧基化以促进水乳化的增强、硅氧基化(siloxylation)以提供亲脂相容性、酯化以协助肥皂和洗涤剂组合物相容性。另外，丝蛋白可通过功能集团产生衍生物，功能基团包括但不限于胺、环氧乙烷、氰酸盐、羧酸酯、硅酮多羟基化合物(silicone copolyols)、硅氧烷酯、季铵化脂肪胺、氨基甲酸乙酯、聚丙烯酰胺、二羧酸酯和卤代酯。丝蛋白也可通过和二亚胺酯反应和形成金属盐产生衍生物。

与上述对“多肽”(及“蛋白质”)的定义一致，所述的衍生物和/或修饰分子此处也概括的称之为“多肽”和“蛋白质”。

本发明丝蛋白可与其他类型纤维纺在一起和/或成束或编织。其例子包括但不限于聚合纤维(如聚丙烯、尼龙、聚酯)、其他植物和动物来源的纤维或丝(如棉、毛、家蚕或蜘蛛丝)和玻璃纤维。优选的实施方式是丝纤维和10％的聚丙烯纤维编织。本发明包括可容易的用来增强任何想要特性的纤维组合的产物，例如外观、柔软性、重量、耐久性、抗水性、改善制造成本，这些可能是在制造和生产医学、工业或商业应用纤维过程中所一般寻求的性质。

个人护理产品

化妆品和皮肤养护组合物可为无水组合物，包括在化妆用介质中有效量的丝蛋白。这些组合物的用途包括但不限于皮肤养护、皮肤清洁、化妆和抗皱纹产品。化妆品和皮肤养护组合物中有效量的丝蛋白此处定义为约10^-4到约30％的重量比例，但优选的从约10^-3到15％重量，相对于组合物的总重量。该比例可根据化妆品或皮肤养护组合物的类型成函数变化。US 6,280,747中描述了化妆用介质的适当组合物。例如，化妆用介质可包括一般从相对于组合物总重约10到约90％重量比例的脂质，其中脂相包括至少一种液体、固体或半固体脂质。脂质包括但不限于油、蜡、树胶和所谓的糊状脂质。另外，组合物可为稳定分散的形式，如作为油包水或水包油乳状液。此外，该组合物可包括一种或一种以上常规的化妆品或皮肤病学的添加剂或佐剂，包括但不限于抗氧化剂、保藏剂、赋形剂、表面活性剂、UVA和/或UVB遮光剂、芳香剂、增稠剂、湿润剂和阴离子、非离子或两性聚合物，以及染料或色素。

包括至少一种本发明丝蛋白的使用乳化材料的可生产的乳化化妆品和准药物包括，例如，清洁化妆品(美容香皂、洁面、香波、淋洗等)、护发产品(染发剂、美发剂之类)、基本化妆品(一般乳膏、乳液、剃毛膏、调节剂、科隆香水、修面液、美容油、面膜等等)、化妆美容用品(底、画眉笔、眼膏、眼影、修眉液等等)、芳香化妆品(香水之类)、晒黑和防晒化妆品(晒黑和防晒霜、晒黑和防晒露、晒黑和防晒油等)、指甲化妆品(指甲油之类)、眼线化妆品(眼线膏之类)、唇化妆品(唇膏、唇霜之类)、口腔护理用品(牙刷之类)、洗浴用品(洗浴产品之类)等等。

化妆品组合物也可以指甲护理产品的形式，如指甲油。此处指甲油定义为处理和染色指甲的组合物，包括化妆用介质中有效量的丝蛋白。指甲油组合物中有效量的丝蛋白此处定义为相对于油总重约10^-4到约30％的重量比例。US 6,280,747描述了指甲油化妆用介质的组成。指甲油典型的包括溶剂和膜形成物质，如纤维素衍生物、聚乙烯衍生物、丙烯酸脂聚合物或共聚物、乙烯共聚物或聚酯聚合物。该组合物也可包括有机或无机色素。

护发组合物此处定义为处理头发的组合物，包括但不限于香波、调节剂、洗液、气雾剂、凝胶剂和奶油冻剂，其中在化妆用介质中包括有效量的丝蛋白。护发组合物中有效量的丝蛋白此处定义为相对于该组合物总重约10^-2到约90％的重量比例。US 2004/0170590、US 6,280,747、US 6,139,851和US 6,013,250中描述了护发组合物中化妆用介质的组成。例如护法组合物可为水、醇或水醇溶液，对于水醇溶液，醇优选地为乙醇或异丙醇，相对于总重约1-约75％的重量比例。此外，护发组合物可包括一种或一种以上常规的化妆品或皮肤病学的添加剂或佐剂，如上所述。

染发组合物此处定义为着色、染色、脱色的组合物，包括在化妆用介质中有效量的丝蛋白。染发组合物中有效量的丝蛋白此处定义为相对于该组合物总重约10^-4到约60％的重量比例。US 2004/0170590、US 6,398,821和US 6,129,770中描述了染发组合物中化妆用介质的组成。例如，染发组合物一般包括无机过氧化染料氧化剂和可氧化着色剂。过氧化染料氧化剂最通常的是过氧化氢。氧化染发剂通过氧化偶联初级中间物(例如对苯二胺、对氨基苯酚、对二氨基嘧啶、羟基吲哚、吲哚胺、胸腺嘧啶胺或青色苯酚(cyanophenols)与次级中间物(例如苯酚、间苯二酚、m-氨基苯酚、m-苯二胺、萘酚、吡唑酮、羟基吲哚、儿茶酚或吡唑)而形成。另外，染发组合物可包括氧化酸、多价螯合剂、稳定剂、增稠剂、缓冲载体、表面活性剂、溶剂、抗氧化剂、聚合物、非氧化染料和调节剂。

丝蛋白也可用来包被色素和化妆品颗粒，以改善该颗粒的分散性，用于化妆品和包被组合物。化妆品颗粒此处定义为化妆品组合物中应用的如色素或惰性粒子之类的粒状物质。适当的色素和化妆品颗粒包括但不限于无机有色色素、有机色素和惰性粒子。无机有色色素包括但不限于二氧化钛、氧化锌、以及铁、镁、钴、铝氧化物。有机有色色素包括但不限于D&C红No.36、D&C橙No.17、D&C红Nos.7，11，31和34钙色淀、D&C红No.12钡色淀、D&C红No.13锶色淀、FD&C黄No.5铝色淀和炭黑粒子。惰性粒子包括但不限于碳酸钙、硅酸铝、硅酸钙、硅酸镁、云母、滑石、硫酸钡、硫酸钙、粉末尼龙(powdered Nylon^TM)、全氟化烃和其他惰性塑料。

丝蛋白也可用于牙线(例如，见US 2005/0161058)。该线可为单丝线或多丝线，纤维可以扭曲也可以不扭曲。牙线可包装成单个或包装成带有切割工具可切割成任意长度的卷。牙线可提供成除丝状之外的许多形状，例如但不限于贴或片之类。该线可包被不同的材料，例如但不限于蜡、牙线用聚四氟乙烯单纤丝。

丝蛋白也可用于肥皂(如，见US 2005/0130857)。

色素和化妆品粒子包被

用于色素和化妆品粒子包被有效量的丝蛋白此处定义为相对于干重粒子的约10^-4到约50％，但优选地从约0.25到约15％的重量比例。所用的最优丝蛋白量取决于要包被色素或化妆品粒子的类型。例如无机有色色素的丝蛋白用量优选地在约0.01％到20％重量之间。对于有机色素，优选的丝蛋白量在约1％到约15％重量，而对于惰性粒子，优选的量在约0.25％到约3％重量。US 5,643,672中描述了制备包被色素和粒子的方法。这些方法包括：在搅拌混合的同时加入丝蛋白水溶液，形成丝蛋白和该粒子的浆并干燥，喷雾干燥丝蛋白溶液到粒子上或低压冻干丝蛋白和粒子浆。包被的色素和化妆品颗粒可用于化妆品组分、油漆、墨水之类。

生物医学

丝蛋白可用于包被绷带以促进伤口愈合。为此，绷带材料用有效量的丝蛋白包被。对于伤口愈合绷带的目的，有效量的丝蛋白此处定义为相对于绷带材料重量的约10^-4到约30％的重量比例。要包被的材料可为任何柔软的、生物惰性的、多孔的布或纤维。例子包括但不限于棉、丝、人造丝、醋酸盐、丙烯酸树脂、聚乙烯、聚酯及其组合。布或纤维的包被可通过许多本领域已知的方法完成。例如，被包被的材料浸入含有丝蛋白的水溶液中。另外，包括丝蛋白的溶液也可使用喷枪喷洒到要包被材料的表面上。此外，包括丝蛋白的溶液也可通过滚动包被印刷方法包被到表面上。伤口绷带可包括其他添加剂，包括但不限于消毒剂如碘、碘化钾、碘化聚烯吡酮、利凡诺、过氧化氢、苄烷铵氯化物、醋酸氯己啶；加速治愈剂如尿囊素、盐酸狄布卡因和苹果酸氯化苯胺；收缩血管剂如盐酸萘甲唑啉；收敛剂如氧化锌；和结痂剂如硼酸。

本发明丝蛋白也能以薄膜的形式用作伤口敷料。US 6,175,053描述了丝蛋白以无定形薄膜的形式用作伤口敷料。无定形薄膜包括结晶度低于10％的致密无孔且包括有效量丝蛋白的膜。对于创伤护理的膜，有效量丝蛋白此处定义为约1到99％重量比例。该膜也可包括其他成分包括但不限于其他蛋白如丝胶蛋白和消毒剂、加速治愈剂、收缩血管剂、收敛剂和结痂剂，如上面所述。其他蛋白如丝胶蛋白可包括1到99％组合物重量。所列其他物质的总量优选地低于约30％重量，更优选地在约0.5到20％组合物重量。伤口敷料薄膜可通过在水溶液中溶解上述材料，通过过滤或离心去除不溶物，将溶液浇铸到光滑固体表面如丙烯酸盘，然后干燥。

本发明丝蛋白也可用于缝合(如，见US 2005/0055051)。该缝合的特征是用超高分子量纤维和丝纤维做成编织套。聚乙烯提供强度。聚酯纤维和高分子量的聚乙烯编织在一起而提供了改良的拴系特性。该丝可用对比色以提供改良的缝合识别和鉴定痕迹。丝比其他纤维更能和组织的相适应，允许在靠近打结的地方剪掉末端而不必担心缝合末端和周围组织的有害相互作用。高强度缝合线的处理特性也可通过使用不同材料包被缝合线而得到增强。该缝合线有利具有Ethibond 5号线的强度，而其直径、感觉和拴系能力和2号缝合线一样。因此，该缝合线对于大部分整形外科操作，如旋转套修复术、跟骨腱修复术、髌韧带修复术、ACL/PCL重建、肩臀重建操作，以及代替用于缝合锚中以及和缝合锚一起使用的缝合线来说是理想的。该缝合线可不包被，或用蜡(蜂蜡、石油蜡、聚乙烯蜡或其他)、硅酮(Dow Corning硅酮流体202A或其他)、硅酮橡胶、PBA(聚丁酸)、乙基纤维素(Filodel)或其他包被物包被，以改善编织物的润滑性、结安全性或耐磨性等等。

本发明丝蛋白也可用于支架(如，见US 2004/0199241)。例如，支架移植物包括管腔内支架和移植物，其中支架移植物包括丝。该丝诱导接受支架移植物的宿主的应答，而该应答能使丝支架移植物与接近丝支架移植物的丝的组织之间的粘连增强。所述的丝可通过多种方法中的任何一种结合到移植物上，例如，通过将丝交织到移植物上或通过附着到移植物上(例如通过粘合剂或缝合的方法)。丝的形式可以为线、穗带、片层、粉末等等。对于丝在支架移植物上的位置，可仅附着到支架的表面，和/或附着到支架移植物的远端区，以协助远端区固定在宿主中的邻近组织。在本发明的背景中可使用多种支架移植物，取决于所需治疗的位置和性质。支架移植物可以是，例如分叉的或管状移植物、圆柱状或逐渐变细、可自展或球形展开的、单片或组件等等。

除了丝以外，支架移植物可在一些或所有丝上进行包被，其中该包被在支架移植物插入宿主时降解，因此该包被延缓丝和宿主之间接触的时间。适当的包被包括而不限于明胶、可降解聚酯(例如PLGA、PLA、MePEG-PLGA、PLGA-PEG-PLGA及其共聚物和掺和物)、纤维素和纤维素衍生物(例如羟丙基纤维素)、多糖(例如透明质酸、葡聚糖、硫酸葡聚糖、壳聚糖)、脂质、脂肪酸、糖脂、核酸酯、聚酐、多正酯类和聚乙烯醇(PVA)。含丝的支架移植物可包括生物活性剂(药物)，其中该制剂从支架移植物中释放而后诱导增强的细胞应答(例如，细胞或细胞外基质沉淀)和/或插入支架移植物宿主的纤维变性反应。

本发明丝蛋白也可用于体外生产韧带和腱的基质中(例如，见US2005/0089552)。多能细胞，如骨髓基质细胞(BMSCs)种植在丝纤维基质中。生物工程韧带或腱的有利特点是在应用机械力方向上的细胞定向和/或基质卷曲模式，以及若施加了机械力，沿着该机械力或刺激所产生的机械负荷的轴上产生的韧带和腱特异性标记包括胶原I型、胶原III型和纤连蛋白。在一个优选实施方式中，所述的韧带或腱的特点是螺旋组织排列的纤维束。一些能够生产的韧带或腱的例子包括前十字韧带、后十字韧带、回旋肌腱群、肘和膝的内侧副韧带、手的屈肌腱、踝的外侧韧带以及颌和颞颌关节的腱和韧带。本发明可生产的其他组织包括软骨(关节和半月板都包括)、骨、肌肉、皮肤和血管。

本发明丝蛋白也可用于水凝胶(例如，见US 2005/0266992)。丝心蛋白水凝胶具有开孔结构特征，使它们可在细胞培养、伤口和烧伤敷料、软组织替代物、骨赋形剂中用作组织工程支架和底物，以及药学或生物学活性化合物的支持物。

所述的丝蛋白也可用于皮肤病学组合物(例如，见US 2005/0019297)。此外，本发明丝蛋白及其衍生物也可用于持续释放组合物(例如，见US 2004/0005363)。

纺织

本发明丝蛋白也可用于纤维表面而后用于纺织中。这将在纤维上提供单层蛋白膜而产生光滑产品。US 6,416,558和US 5,232,611描述了加入抹光包被到纤维上。这些揭示中描述的方法提供了多种抹光纤维以提供良好感觉和光滑表面的例子。用于这种用途时，使用有效量丝蛋白包被纤维。为用于纺织中包被纤维的目的，有效量丝蛋白此处定义为相对于纤维材料重量的约1到约99％重量比例。纤维材料包括但不限于棉纺织纤维、聚酯如人造丝和Lycra^TM、尼龙、毛织物和其他天然纤维包括土丝。适合将丝蛋白用于纤维上的组合物可包括助溶剂如乙醇、异丙醇、己芴醇(hexafluoranols)、异硫代氰酸盐(isothiocyanouranates)和其他能够和水混合形成溶液或微乳化液的极性溶剂。包括丝蛋白的溶液可喷到纤维上或将纤维浸到溶液中。尽管不是必须的，包被材料优选地进行快速干燥。另一种方案是将丝蛋白组合物应用到编织纤维上。该应用理想的实施方式为将丝蛋白用于包被可伸展的编织物如用于长袜。

复合材料

丝纤维可加入到聚氨酯、其他树脂或热塑性填充物中制备面板和其他建筑材料或替代木材和颗粒板用模型器具和台阶顶(benchtop)。该复合材料也可用于建筑和汽车制造特别是屋顶和门板。丝纤维增强树脂使该材料更强且允许与其他颗粒板和组合材料相比相同或更高强度而重量轻的构造。丝纤维可分离并加入合成的形成复合材料的树脂中或与从植物中获得的蛋白质、淀粉和油联合使用以生产生物复合材料。JP 2004284246、US 2005175825、US 4,515,737、JP 47020312和WO 2005/017004描述了生产这种材料的方法。

纸添加物

本发明的丝的纤维性质可增加造纸的强度和品质结构。通过棉浆中斑纹丝线制作的丝纸，以制备超平滑手工纸，可用于礼品包装、笔记本封面、纸袋中。JP2000139755中一般描述了生产包括本发明丝蛋白纸制品的方法。

高级材料

本发明的丝具有相当的韧性，并且变湿的时候在维持这些性质方面与其他丝不同(Hepburn等人，1979)。

服装纺织工业的技术和智能纺织领域具有实质性的增长。对健康、高功能值、环境友好型和个人化的织品需求越来越多。如本发明所述的纤维在变湿的时候不改变其性质，特别是维持了它们的强度和伸展性，可用于运动休闲的功能性服装以及工作服和保护服装中。

武器和监视技术的发展促进了个人防护设备和战场相关系统和结构的创新。除了可满足常规需要，如长时间暴露的耐用性、重型服装和对外部环境的保护之外，本发明丝织品可加工成抗发射物冲击、火和化学品的织品。WO 2005/045122和US 2005268443描述了生产上述材料的方法。

实施例

实施例1-晚末龄幼虫唾液腺cDNA的制备和分析

在真针尾类和脉翅目昆虫(意大利蜂(Apis mellifera)、授粉熊蜂(Bombusterrestris)、牛头犬蚁(Myrmecia foricata)、黄猄蚁(Oecophylla smaragdina)、玛草蛉(Mallada signata))丝中发现的蛋白通过将胰蛋白酶消化该丝，获得多肽的离子阱连续质谱(MS/MS)片段模式与从晚末龄幼虫唾液腺中分离的cDNA编码蛋白的预测质谱数据进行匹配来鉴定。为确定通过这种方法对蜜蜂进行分析时不遗漏任何蛋白，肽质谱分析数据也和蜜蜂基因组计划预测的，以及Amel3蜜蜂基因组序列所有六个读码框翻译的意大利蜂(Apis mellifera)蛋白质的虚拟胰蛋白酶消化产物相比较。

蜜蜂

意大利蜂(Apis mellifera)幼虫从驯养蜂房中得到。以前研究表明意大利蜂丝的产生限制在末龄幼虫后半段时的唾液腺中(Silva-Zacarin等人，2003)。在此阶段，RNA在该腺的后端更丰富(Flower和Kenchington，1967)。从浸在磷酸盐缓冲盐水中晚五期蜜蜂幼虫中分离50个唾液腺的立方形细胞区。分离唾液腺的后端立即放入(Ambion，Austin，TX，USA)中以稳定mRNA，然后保存在4℃。

使用Ambion(Austin，TX，USA)公司PCR试剂盒RNAqueous从晚末龄幼虫唾液腺中分离总RNA(35μg)。使用Invitrogen(Calsbad，CA，USA)Micro-FastTrack^TM2.0mRNA分离试剂盒按制造商说明从总RNA中分离信使RNA，分离的mRNA洗脱到10μl无RNAse水中。

使用Invitrogen(Calsbad，CA，USA)CloneMiner^TM cDNA文库构建试剂盒用从蜜蜂幼虫中分离的mRNA构建cDNA文库，对标准方案进行下述修改：第一条链合成，6pmol.μl^-1生物素-attB2-Oligo(dT)引物0.5μl及每种2mM dNTPs 0.5μl加入到10μl mRNA中。65℃温育5min然后45℃2min，加入2μl 5×第一条链缓冲液，1μl 0.1M DTT，以及0.5μl 200U.μl^-1Superscript^TM II RT。对于第二条链合成，所有试剂的总体积减半，乙醇沉淀后，用5μl DEPC处理水重悬浮cDNA。aatB1接头(1μl)在总体积10μl中连接，其中5μl cDNA，2μl 5×接头缓冲液，1μl 0.1M DTT以及1μlT4 DNA连接酶(1U.μl^-1)，在16℃连接48hrs，16小时候额外加入0.5μl T4 DNA连接酶(1U.μl^-1)。按照制造商说明根据cDNA大小进行分选，对300-500μl样品进行洗脱，乙醇沉淀，重悬浮并转化入大肠杆菌DH10B^TM T1抗噬菌体细胞中，如推荐的那样。cDNA文库包括大约1,200,000集落形成单位(cfu)，带有大约1％原载体。平均插入大小为1.3±1.4kbp。

随机挑选82个集落，使用GenomeLab^TM DTCS Quick start试剂盒(BeckmanCoulter，Fullerton CA USA)在CEQ8000Biorad测序仪上测序。其聚类到54个组(表2)。编码丝蛋白的cDNA的鉴定如下所述。

其他物种

使用Ambion(Austin，TX，USA)公司PCR试剂盒RNAqueous从晚末龄幼虫唇腺中从下述物种中分离总RNA：4熊蜂(授粉熊蜂，Bombus terrestris)(2μg RNA)、4牛头犬蚁(Myrmecia forficata)(3μg RNA)约100织工蚁(黄猄蚁，Oecophyllasmaragdina)(0.4μg RNA)和约50绿草蜻蛉(玛草蛉，Mallada signata)。使用Invitrogen(Calsbad，CA，USA)Micro-FastTrack^TM 2.0mRNA分离试剂盒从总RNA中分离mRNA，溶入终体积10μl水中。使用Invitrogen(Calsbad，CA，USA)CloneMiner^TM cDNA试剂盒用从mRNA构建cDNA文库，对标准方案进行下述修改：第一条链合成，3pmol生物素-attB2-Oligo(dT)引物及1nmol每种dNTPs加入到10μl mRNA中。65℃温育5min然后45℃2min，加入2μl 5×第一条链缓冲液，50nmol DTT，以及100U Superscript^TM II RT。

表2.蜜蜂末龄唾液腺cDNA以及SDS处理巢房丝胰蛋白酶消化肽的MS离子阱片段模式

对于第二条链合成，所有试剂的总体积根据制造商推荐量减半，乙醇沉淀后，用5μl DEPC处理水重悬浮cDNA。aatB1接头(1μl)在总体积10μl中连接，其中5μlcDNA，2μl 5×接头缓冲液，50nmol DTT，以及1U T4DNA连接酶，在16℃连接12hrs。cDNA文库包括大约2.4×10⁷(熊蜂)，5.0×10⁷(牛头犬蚁)和6000(绿蚂蚁)集落形成单位(cfu)，带有对于牛头犬蚁和熊蜂文库低于1％以及在绿蚂蚁文库中大于80％原载体。文库中平均插入大小为1.3Kbp。

序列数据从熊蜂和牛头犬蚁cDNA文库中多于100个随机克隆、蜜蜂82个克隆及草蜻蛉60个克隆中获得。从绿蚂蚁(大约1mm长)中获得唾液腺存在技术困难，降低了该物种文库的效率，因而仅检查了40条序列。表3提供了所鉴定的丝蛋白的总结。

表3.真针尾类丝蛋白的鉴定和特性

物种	蛋白名称	蛋白长度(氨基酸)	％cDNA文库克隆	不同总计MS/MS检索分值	％螺旋结构^**	MARCOIL预测的卷曲螺旋长度^***(氨基酸)
物种	蛋白名称	蛋白长度(氨基酸)	％cDNA文库克隆	不同总计MS/MS检索分值	％螺旋结构^**	MARCOIL预测的卷曲螺旋长度^***(氨基酸)	蜜蜂	AmelF1^*	333	6	52	76	117
蜜蜂	AmelF2^*	290	7	51	88	175	蜜蜂	AmelF1^*	333	6	52	76	117
蜜蜂	AmelF2^*	290	7	51	88	175	蜜蜂	AmelF3^*	335	11	107	81	154
蜜蜂	AmelF4^*	342	7	88	76	174	蜜蜂	AmelF3^*	335	11	107	81	154
蜜蜂	AmelF4^*	342	7	88	76	174	蜜蜂	AmelSA1^*	578	13	40	41	45
大黄蜂	BBF1	327	4	180	86	147	蜜蜂	AmelSA1^*	578	13	40	41	45
大黄蜂	BBF1	327	4	180	86	147	大黄蜂	BBF2	313	14	100	84	199
大黄蜂	BBF3	332	20	218	86	146	大黄蜂	BBF2	313	14	100	84	199
大黄蜂	BBF3	332	20	218	86	146	大黄蜂	BBF4	357	32	137	80	188
大黄蜂	BBSA1	＞501	3	138	21	0	大黄蜂	BBF4	357	32	137	80	188
大黄蜂	BBSA1	＞501	3	138	21	0	牛头犬蚁	BAF1	422	16	99	69	121
牛头犬蚁	BAF2	411	30	90	76	132	牛头犬蚁	BAF1	422	16	99	69	121
牛头犬蚁	BAF2	411	30	90	76	132	牛头犬蚁	BAF3	394	26	88	79	131
牛头犬蚁	BAF4	441	24	116	76	157	牛头犬蚁	BAF3	394	26	88	79	131
牛头犬蚁	BAF4	441	24	116	76	157	织工蚁	GAF1	391	35	228	74	177
织工蚁	GAF2	400	22	191	79	158	织工蚁	GAF1	391	35	228	74	177
织工蚁	GAF2	400	22	191	79	158	织工蚁	GAF3	395	13	156	72	103
织工蚁	GAF4	443	17	148	74	166	织工蚁	GAF3	395	13	156	72	103
织工蚁	GAF4	443	17	148	74	166	草蜻蛉	MalF1	596	23	45	89	151

^*此处也分别称为Xenospira1-4和Xenosin，^**PROFsec预测，^***MARCOIL以90％阈值预测

实施例2土丝的制备和蛋白分析

去除幼虫后的蜜蜂巢房、去除幼虫后的熊蜂茧、去除幼虫后的的牛头犬蚁茧或织工蚁丝层在温水中广泛洗三次去除水溶性污染物，然后在用氯仿广泛洗三次除蜡。通过蒸馏水淋洗除氯仿，保留一团所述的丝用于分析。一团膜翅目昆虫(蚂蚁和蜜蜂)丝样品进一步在0.05％煮沸碳酸钠溶液中洗涤30分钟，这是蚕茧丝脱胶的标准程序，然后用蒸馏水淋洗。草蜻蛉丝仅用蒸馏水淋洗。一团草蜻蛉丝样品通过在0.05％碳酸钠溶液煮沸30分钟脱胶。

一团蜜蜂材料在2％SDS 95℃浸湿过夜，然后用蒸馏水淋洗三次。热SDS溶液提取溶解了大部分蛋白，但丝层保持了其构象。

清洁的丝通过液相层析，然后通过串联质谱(LCMS)分析，如下所述。

清洁的丝团放在Millipore′zipplate′96孔微滴定板的孔中，该板的每个孔包括通过该孔底部的C18反相层析介质栓塞，并在其中加入20μl 25mM含有160ng测序级纯胰蛋白酶(Promega)的碳酸氢铵溶液。然后该板在30℃增湿塑料袋中温育过夜。

通过在每个孔的边上吸入乙腈(10μl)润湿C18材料，在37℃保温该板15分钟。每孔中加入甲酸溶液(130μl，1％v/v)，30分钟后，通过逐渐降低真空从板底缓慢抽吸每个孔的溶液收获C18材料上的消化蜜蜂蛋白的肽。通过抽吸100μl甲酸溶液两次洗涤C18材料。通过直接加入C18材料中6μl 1％甲酸加入70％甲醇后立即离心，将肽通过C18栓塞洗脱到下面的微滴定板中。该板置入真空中，直到通过蒸发每孔中的体积降低约2倍。每孔中加入甲酸溶液(10μl)，并将该板转移到Agilent 1100毛细管液相层析系统的孔板取样器中。

丝提取物中的肽(8μl)结合到Agilent Zorbax SB-C185μm 150×0.5mm柱中，以0.1％甲酸/5％乙腈20μl.min^-11分钟然后用逐渐增加乙腈浓度到0.1％甲酸/20％乙腈的梯度5μl.min^-1洗脱超过1分钟，然后到0.1％甲酸/50％乙腈超过28分钟，然后到0.1％甲酸/95％乙腈超过1分钟。该柱子通过0.1％甲酸/95％-100％乙腈以20μl.min^-1洗超过5分钟，并下一孔样品肽上样前以0.1％甲酸/5％乙腈重平衡7分钟。

柱中的洗脱物通过仪器的电喷雾离子源微喷雾器引入Agilent XCT离子阱质谱仪中。简单的说，当肽从柱中洗脱时，离子阱收集全谱阳性离子扫描(100-2200m/z)，然后两次MS/MS扫描在全谱扫描中观察到的离子，避免选择带有单电荷的离子。当选定进行MS/MS分析的离子后，所有其他离子都从离子阱排除，选定的离子根据仪器推荐的″SmartFrag″和″Peptide Scan″设置片段化。一旦收集到任何特定m/z值的两个片段谱，其在另外30秒被排除在选定的分析外，以避免收集冗余数据。

整个实验的质谱数据组使用Agilent′s Spectrum Mill软件分析，与从cDNA文库中预测的蛋白序列数据匹配。软件产生实验观察到的肽片段质量组与根据提供的数据库中蛋白序列可能产生的预测片段之间每个匹配质量的得分值。此处报告所有序列匹配的得分大于20，这是自动有把握接受有效匹配的缺省设置。

本分析鉴定出五种唇腺中高水平表达的蛋白质与来源于每个蜜蜂种同源的丝匹配(如表2和表3所示)，以及四种唇腺中到水平表达的蛋白质与来源于每个蚂蚁种同源的丝匹配(如表3所示)。幼虫唇腺中编码这些蛋白的信使RNA丰度与所产生蛋白的丰度一致(信使的丰度如表3所示)。

为保证通过这种鉴定方法没有遗漏任何蜜蜂丝蛋白，我们也将蜜蜂丝胰蛋白酶肽质谱数据与一组公众可获得的蜜蜂基因组计划预测的蛋白序列相比较，其通过计算机算法为努力识别蜜蜂全部基因组DNA序列中可转录的基因而产生。此外，我们根据蜜蜂基因组计划提供的每个连续的基因组DNA序列的六个可能的读码框产生翻译数据库(Amel3公布)。这些翻译的DNA序列呈现到Spectrum Mill软件，如同它们是非常大的蛋白质序列一样。匹配MS/MS肽数据鉴定出编码部分分离的蜜蜂蛋白质的基因组序列内的开放读码框，而不必首先预测基因的组织。通过这种方法没有鉴定出丝中另外的蛋白。

实施例3-土丝的结构分析

土丝样品如实施例2描述的进行制备。丝样品通过带有Pike Miracle钻石衰减全反射附件的Bruker Tensor 37傅立叶变换红外光谱仪检查。对蜜蜂、熊蜂、绿蚂蚁、牛头犬蚁和草蜻蛉幼虫丝(图1)的酰胺I区、II区光谱分析表明所有这些丝都有主要的α螺旋二级结构。真针尾类的丝具有在FT-IR光谱1645-1646cm^-1处的优势峰，比经典的α螺旋信号向下移动大约10cm^-1并加宽。这种α螺旋信号的移动是典型的卷曲螺旋蛋白(Heimburg等人，1999)。脱胶样品的光谱没有发生变化。

实施例4-土丝的氨基酸组成与鉴定的丝蛋白十分相似

土丝的氨基酸组成通过使用Australian Proteome Analysis Facility Ltd(Macquarie University，Sydney)的Waters AccQTag化学110℃气相水解24小时后确定。

测得的SDS洗涤丝的氨基酸组成与鉴定的丝蛋白序列预测的相似(图2和3)。

实施例5-丝蛋白结构分析

预测的分泌肽

如对丝蛋白预期的一样，使用两个模型鉴定信号肽的SignalP 3.0信号预测程序(Bendtsen等人，2004)预测所有鉴定的编码蛋白的丝基因包括将它们从细胞中定向分泌的信号肽(数据未示)。该多肽预测的切割位点如下：

Xenospira1(AmelF 1)-在pos 19和20(ASA-GL)之间，

Xenospira2(AmelF2)-在pos 19和20(AEG-RV)之间，

Xenospira3(AmelF3)-在pos 19和20(VHA-GV)之间，

Xenospira4(AmelF4)-在pos 19和20(ASG-AR)之间，

Xenosin(AmelSA1)-在pos 19和20(VCA-GV)之间，

BBF1-在pos 19和20(ASA-GQ)之间，

BBF2-在pos 20和21(AEG-HV)之间，

BBF3-在pos 19和20(VHA-GS)之间，

BBF4-在pos 19和20(ASA-GK)之间，

BAF1-在pos 19和20(ASA-SG)之间，

BAF2-在pos 19和20(ASG-RV)之间，

BAF3-在pos 19和20(ASG-NL)之间，

BAF4-在pos 19和20(VGA-SE)之间，

GAF1-在pos 19和20(ADA-SK)之间，

GAF2-在pos 19和20(ASG-GV)之间，

GAF3-在pos 19和20(ASG-GV)之间，

GAF4-在pos 19和20(VGA-SE)之间，

MalF1-在pos 26和27(SST-AV)之间。

蚂蚁所有的四种和蜜蜂五种丝蛋白中的四种丝蛋白是螺旋的并具有卷曲螺旋结构。

蛋白模型和模式识别算法的结果证实大部分鉴定的蜜蜂丝蛋白是形成卷曲螺旋的螺旋蛋白。

PROFsec(Rost和Sander，1993)和NNPredict(McClelland和Rumelhart，1988；Kneller等人，1990)算法被用于研究鉴定的丝基因的二级结构。这些算法鉴定出Xenospira1[GB 12184-PA](SEQ ID NO：1)、Xenospira2[GB 12348-PA](SEQ IDNO：3)、Xenospira3[GB17818-PA](SEQ ID NO：5)和Xenospria4[GB19585-PA](SEQID NO：7)是高度螺旋蛋白，具有76-85％之间的螺旋结构(表4)。Xenosin[GB15233-PA](SEQ ID NO：10)具有显著少的螺旋结构。

表4.PROFsec(Rost和Sander，1993)预测的意大利蜂丝蛋白二级结构显示螺旋、延伸片层和环的百分数

更多的蛋白模型和模式识别算法的结果证实大部分鉴定的蜜蜂丝蛋白是形成卷曲螺旋的螺旋蛋白。PredictProtein(Rost等人，2004)算法被用来研究鉴定丝基因的二级结构。这些算法鉴定出Xenospira1(SEQ ID NO：1)、Xenospira2(SEQ IDNO：3)、Xenospira3(SEQ ID NO：5)、Xenospira4(SEQ ID NO：7)、BBF1(SEQ IDNO：22)、BBF2(SEQ ID NO：24)、BBF3(SEQ ID NO：26)、BBF4(SEQ ID NO：28)、BAF1(SEQ ID NO：40)、BAF2(SEQ ID NO：42)、BAF3(SEQ ID NO：44)、BAF4(SEQID NO：46)、GAF1(SEQ ID NO：56)、GAF2(SEQ ID NO：58)、GAF3(SEQ ID NO：60)、GAF4(SEQ ID NO：62)和MalF1(SEQ ID NO：72)是高度螺旋蛋白，具有69-88％之间的螺旋结构(表3)。AmelSA1[GB15233-PA](Xenosin)(SEQ ID NO：10)和BBSA1(SEQ ID NO：30)具有显著少的螺旋结构。

螺旋蛋白的超螺旋(卷曲螺旋)来自于一般记为(abcdefg)_n的特征性七肽重复序列，a和d位残基一般为疏水残基，剩余位置一般为带电或极性残基。模式识别程序(MARCOIL(Delorenzi和Speed，2002)、COILS(Lupas等人，1991))在Xenospira1[GB12184-PA](SEQ ID NO：1)、Xenospira2[GB12348-PA](SEQ ID NO：3)、Xenospira3[GB17818-PA](SEQ ID NO：5)和Xenospira4[GB19585-PA](SEQ IDNO：7)(MARCOIL：表5，COILS：图4)，以及BBF1(SEQ ID NO：22)、BBF2(SEQID NO：24)、BBF3(SEQ ID NO：26)、BBF4(SEQ ID NO：28)、BAF1(SEQ ID NO：40)、BAF2(SEQ ID NO：42)、BAF3(SEQ ID NO：44)、BAF4(SEQ ID NO：46)、GAF1(SEQID NO：56)、GAF2(SEQ ID NO：58)、GAF3(SEQ ID NO：60)、GAF4(SEQ ID NO：62)和MalF1(SEQ ID NO：72)(MARCOIL：表3)中鉴定出无数的卷曲螺旋典型的七肽重复。

蜜蜂丝蛋白中一种新的卷曲螺旋序列的鉴定

在Xenospira1[GB 12184-PA]、Xenospira2[GB 12348-PA]、Xenospira3[GB17818-PA]、Xenospria4[GB19585-PA]序列中鉴定出的七肽氨基酸残基重复每个都高度指示一种卷曲螺旋二级结构(图5)(置信水平见表5)。发现的七肽数目众多并且连续暗示该蛋白采取一种非常规则的结构。在两种蜜蜂蛋白中鉴定出了重叠的多肽：Xenospira1的主要卷曲螺旋区包括有3个残基偏移的重叠七肽，接着有5个残基的空隙，然后是4个连续的七肽；Xenospira2整个卷曲螺旋区有多个重叠七肽，有一个单个偏移和4个残基偏移(相当于3个残基偏移)。主要七肽不同位置的氨基酸组成显示在表6的第一栏，重叠七肽的位置显示在邻近的栏里。

表5.MARCOIL(Delorenzi和Speed，2002)模式识别算法预测的鉴定丝蛋白中以卷曲螺旋存在的残基百分数。

令人惊奇的是当集中起来看时主要七肽具有新颖的组成——在“疏水”七肽位a和d具有非同寻常高含量的丙氨酸(见表6和图5)。另外，很大比例的七肽在同一个七肽内部的a和d两个位置都是丙氨酸(Xenospira1[GB12184-PA]中33％；Xenospira2[GB12348-PA]中36％；Xenospira3[GB17818-PA]中27％以及Xenosρira4[GB19585-PA]中38％；见表6和7)。

表6.蜜蜂丝蛋白卷曲螺旋区不同七肽位置每种氨基酸残基数目的总结。

表7.蜜蜂丝蛋白七肽中丙氨酸残基的总结。

蛋白质	螺旋结构数量(％)¹	主要七肽数目	主要七肽中蛋白数量(％)	主要七肽中Ala的数量(％)	主要七肽中a位Ala的数量(％)	主要七肽中d位Ala的数量(％)	主要七肽在中a和d位Ala的数量(％)
蛋白质	螺旋结构数量(％)¹	主要七肽数目	主要七肽中蛋白数量(％)	主要七肽中Ala的数量(％)	主要七肽中a位Ala的数量(％)	主要七肽中d位Ala的数量(％)	主要七肽在中a和d位Ala的数量(％)	Xenospira1	77(70)	27	41	44	74	33
Xenospira2	85(82)	28		37	71	57	36	Xenospira1	77(70)	27	41	44	74	33
Xenospira2	85(82)	28		37	71	57	36	Xenospira3	80(73)	30	37	63	43	27
Xenospira4	77(69)	29		48	79	58	38	Xenospira3	80(73)	30	37	63	43	27
Xenospira4	77(69)	29		48	79	58	38	Xenosin	41(41)		n/a	n/a	n/a	n/a

¹PROFsec预测，NNPredict的预测显示在括号中。

图6和图7总结了膜翅目丝卷曲螺旋区中不同七肽位置的氨基酸组成。如上所述，七肽内的位置具有新颖的组成——蜜蜂和蚂蚁丝的“疏水”七肽位置a和d包括非常高水平的丙氨酸(平均58％)以及高水平的极性残基(平均21％)，相对于其他卷曲螺旋来说。此外，e位非同寻常的小并疏水(表8、图7)。该位置在七肽地形上位于a位残基邻近。a和d位残基的组成相似性暗示该丝采取每个α螺旋三个核心残基的卷曲螺旋结构。核心中三个残基核心比两个残基贡献更大的疏水界面(Deng等人，2006)——这一特征将有助于卷曲螺旋的形成和稳定性。

此外，集中看来七肽内b、c、e、f和g位比以前确定的蛋白卷曲螺旋区一般更为疏水，极性更小且带电更少(见图7，表8和9)。因此，尽管历史上认为有刺的膜翅目昆虫丝的螺旋含量是甘氨酸含量降低和酸性残基成分的增加导致的(Rudall and Kenchington，1971)，我们发现并非甘氨酸/酸性残基决定了新颖的丝结构，而是多肽链中丙氨酸残基的位置决定的。

表8.直系同源膜翅目丝蛋白和绿草蜻蛉丝蛋白(MalF1)的每个七肽位的平均大小和疏水性显示a、d和e位(核心)比其他位置更小且更疏水。有些例子中，b位(部分浸水)也小且疏水。

实施例6-蜜蜂丝蛋白似乎是广泛交联的

蜜蜂丝蛋白都包括高含量的赖氨酸(6.5％-16.3％)。比较测定的蜜蜂丝氨基酸组成和鉴定的丝蛋白的序列显示赖氨酸残基数目的大量不匹配，在丝中检测到的赖氨酸比预期的要少很多(图2和3)。这暗示丝中赖氨酸残基被修饰了，所以通过标准的氨基酸分析不能鉴定出来。已知赖氨酸形成多种交联：或者被赖氨酸氧化酶催化的酶交联，或者糖化赖氨酸残基产生的非酶交联(Reiser等人，1992)。蜜蜂和熊蜂丝氨基酸分析中赖氨酸的低代表性与存在的赖氨酸交联一致。

表9.丝蛋白卷曲螺旋区不同七肽位置每类氨基酸中残基的数目

共价交联的蛋白SDS聚丙烯酰胺胶电泳(PAGE)预期交联复合体的分子量迁移。我们对晚末龄蜜蜂唇腺蛋白SDS PAGE并测量相对于标准蛋白标记的丝蛋白迁移。每个鉴定的丝蛋白单体都观察到了相应的带，然而含有这些蛋白的高分子量带也存在，如在交联系统中所预期的那样(图8)。

如上所述，蜜蜂唇腺包括有组织和无组织丝蛋白的混合物。观察到的交联蛋白可能相应于该腺的前端区蛋白群，该丝即从那里挤出。有理由推测细胞外蜜蜂丝包括大量高比例交联蛋白，比在所有阶段唾液腺丝蛋白异源混合物中观察到的比例要高。键似乎不是半胱氨酸交联，因为还原性处理对该丝没有影响，且鉴定的丝蛋白中包括很少或没有半胱氨酸残基。

实施例7-真针尾类丝蛋白与其他丝蛋白显著不同

真针尾类丝与其他所描述的丝基因在氨基酸组成(表10)、涉及蛋白的分子量、二级结构和物理性质(表11和12)方面显著不同。鳞翅类丝主要由小氨基酸残基丙氨酸、丝氨酸和甘氨酸组成(例如家蚕，表10)，并且支配性的二级结构是广泛的β片层。粉蝶盘绒茧蜂(Cotesia glomerata)含有大量天冬酰胺和丝氨酸——大量的后一残基是鳞翅目丝胶蛋白(丝胶)的特征(表10)。粉蝶盘绒茧蜂(Cotesiaglomerata)的丝蛋白模型并没有在二级结构中鉴定出螺旋或卷曲螺旋。相比之下，蜜蜂、蚂蚁和草蜻蛉的丝富含丙氨酸(表10)，包括形成卷曲螺旋的高水平的螺旋二级结构。

表10.不同昆虫丝的氨基酸组成，最多的残基以黑体显示。

	蜜蜂	真针尾类丝	玛草蛉丝	粉蝶盘绒茧蜂	家蚕
	蜜蜂	真针尾类丝	玛草蛉丝	粉蝶盘绒茧蜂	家蚕	丙氨酸	22.6	27.5	26.9	12.5	29.3
谷氨酸+谷氨酰胺	16.1	13.9	7.4	0.6	0.9	丙氨酸	22.6	27.5	26.9	12.5	29.3
谷氨酸+谷氨酰胺	16.1	13.9	7.4	0.6	0.9	天冬氨酸+天冬酰胺	13.2	8.6	15.0	37.6(Asn 33.7)	1.2
丝氨酸	10.4	11.5	8.5	37.1	11.3	天冬氨酸+天冬酰胺	13.2	8.6	15.0	37.6(Asn 33.7)	1.2
丝氨酸	10.4	11.5	8.5	37.1	11.3	亮氨酸	9.0	7.2	5.9	0.4	0.4
缬氨酸	6.6	4.8	4.1	0.3	2.1	亮氨酸	9.0	7.2	5.9	0.4	0.4
缬氨酸	6.6	4.8	4.1	0.3	2.1	甘氨酸	5.7	6.6	11.2	5.5	46.0
异亮氨酸	5.6	4.0	3.9	0.4	0.6	甘氨酸	5.7	6.6	11.2	5.5	46.0
异亮氨酸	5.6	4.0	3.9	0.4	0.6	苏氨酸	5.1	4.9	5.3	0.5	0.8
赖氨酸	3.7	3.7	3.2	0.1	0.3	苏氨酸	5.1	4.9	5.3	0.5	0.8
赖氨酸	3.7	3.7	3.2	0.1	0.3	苯丙氨酸	2.0	1.0	0.5	0.5	0.6
酪氨酸	0	0.9	0.5	3.1	5.3	苯丙氨酸	2.0	1.0	0.5	0.5	0.6
酪氨酸	0	0.9	0.5	3.1	5.3	脯氨酸	0	0	0	0.7	0.4
组氨酸	0	0.5	0.5	0.4	0.2	脯氨酸	0	0	0	0.7	0.4
组氨酸	0	0.5	0.5	0.4	0.2	精氨酸	0	3.3	5.4	0.2	0.4
甲硫氨酸	0	1.0	1.6	0	0.1	精氨酸	0	3.3	5.4	0.2	0.4
甲硫氨酸	0	1.0	1.6	0	0.1	色氨酸	0	未报道	未报道	未报道	0.2
半胱氨酸	0	0.4	0.3	未报道	0.1	色氨酸	0	未报道	未报道	未报道	0.2

表11.昆虫丝之间的不同

	蚂蚁和蜜蜂丝	玛草蛉丝	盘绒茧蜂种	鳞翅目例如家蚕
	蚂蚁和蜜蜂丝	玛草蛉丝	盘绒茧蜂种	鳞翅目例如家蚕	最多的氨基酸	Ala	Ala	Ser，Asn	Gly，Ala
丝心蛋白大小	25-35kDa	57KDa	约500KDa	＞100KDa	最多的氨基酸	Ala	Ala	Ser，Asn	Gly，Ala
丝心蛋白大小	25-35kDa	57KDa	约500KDa	＞100KDa	二级结构	卷曲螺旋	卷曲螺旋	十分可能是β片层，二级结构预测程序PROFsec和MACOIL没有识别出任何螺旋结构或卷曲螺旋区。	与β折叠、β螺旋、α螺旋和无定形区松散关联的β折叠层

表12.昆虫丝的溶解性

四种膜翅目物种丝蛋白卷曲螺旋区支序分析(图9)暗示该基因在真针尾类从寄生蜂分化前由共同的祖先进化而来。该丝的序列广泛分化，我们仅能比对组成每个蛋白卷曲螺旋区的210个氨基酸。此处提供的每个丝蛋白卷曲螺旋区之间的氨基酸序列同源性显示在表13，且相应区的DNA同源性显示在表14。尽管所述的蛋白质氨基酸含量(特别高水平的丙氨酸)和三级结构相似，主要氨基酸序列的同源性非常低。事实上，编码玛草蛉丝蛋白的基因是独立进化的，因此丝蛋白序列不能和膜翅目序列相比对。这表明氨基酸的同源性可出现相当大的变化，而不影响该蛋白的生物功能。

支序分析预测真针尾蜂的丝包括蚂蚁和蜜蜂丝相关蛋白，尽管这些蛋白与此处描述的蛋白有相似的组成和结构，它们具有高度分化的主序列。

此处提供的丝蛋白氨基酸序列(图10)和蛋白数据库相比较，然而，没有发现具有合理水平序列同源性的(例如丝蛋白序列长度上不大于30％同源性)任何现有技术蛋白。

表13.蚂蚁和蜜蜂中纤维蛋白卷曲螺旋区蛋白序列间同源性百分数。

表14.蚂蚁和蜜蜂中纤维蛋白编码卷曲螺旋区核苷酸序列之间的同源性百分数。

编码这些丝蛋白(图11所提供的)的开放读码框按上述方法进行相似的数据库检索。鉴定出的仅有的相关分子是作为蜜蜂基因组计划的一部分发表的(www.ncbi.nlm.nih.gov/genome/guide/bee)。蜜蜂基因组计划已经预测了开放读码框，然而并没有提示编码蛋白的功能。此外，对于任何这些分子，没有证据表明曾经产生过包括该mRNA开放读码框的多核苷酸。

编码Xenospira1、Xenospira2、Xenosρira3和Xenospira4的基因包括一个覆盖整个单开放读码框的外显子，而编码Xenosin的基因包括至少一个内含子(见图12)。

实施例8-丝蛋白在转基因植物中的表达

编码本发明丝蛋白的植物表达载体可由置于包括卡那霉素抗性基因(Npt II)的双元载体骨架中CaMV 35S启动子下游的编码所述蛋白的重组核酸分子(例如SEQ ID NO′s：11到21、31到39、48到55、64到71、74或75所提供的任何一条多核苷酸)组成。

对于包括SEQ ID NO′s 11、13、15、17、19、31、33、35、37、48、50、52、54、64、66、68、70或74中任一条的多核苷酸，构建物可进一步包括信号肽编码区，如拟南芥液泡碱性几丁质酶信号肽，其置于编码该丝蛋白序列的框架内或上游。

在转化到拟南芥中前通过电穿孔将载有编码多肽丝蛋白的构建物分别转化根癌农杆菌。下胚轴转化法可用于转化拟南芥，其可在包括卡那霉素培养基的选择培养基上选择存活植株。重生体中根形成后，转移到土壤中建立一代转基因植物。

转化过程的验证可通过PCR筛选完成。多核苷酸的掺入和表达通过PCR、Southern印迹分析和/或胰蛋白酶切表达蛋白的LC/MS测定。

同一载体可提供两种或两种以上不同丝蛋白编码构建物，或每个编码一种不同蛋白的许多不同载体可转化到植物中。

作为植物表达的实验实施例，启动子优化版的AmelF4(Xenospira4)(SEQ IDNO：76)克隆到pET14b(Novagen)产生pET14b-6×His：F4op，形成蛋白N端带有6×组氨酸的框内翻译融合蛋白。编码蛋白“6×组氨酸：F4op”的序列克隆到pVEC8(Wang等人，1992)，置于CaMV 35S启动子和ocs多腺苷酸化调节元件的控制之下，产生pVEC8-35S-6×His：F4op-ocs。pET14b-6×His：F4op转化到化学感受态E.coli中，且pVEC8-35S-6×His：F4op通过农杆菌介导转化到烟草叶片中。从抗生素抗性E.coli(诱导表达)和烟草叶中获得的蛋白分离并使用四组氨酸抗体(Qiagen，Karlsrule，Germany)进行western印迹分析检测。空载体pET14b和pVEC8-35S-ocs用于相应的宿主背景中作为负对照。如图13所示，这些实验获得了能产生Xenospira4(AmelF4)蛋白的植物。

实施例9-丝蛋白的发酵和纯化

蜜蜂基因AmelF1-F4(分别为Xenospira1到4)和草蜻蛉MalF1基因通过PCR扩增并克隆到pET14b表达载体(Novagen，Madison，WI)后构建表达构建物。产生的表达质粒电穿孔到E.coli BL21(DE3)Rosetta细胞中并在含有氨苄青霉素的LB琼脂培养基中生长过夜。单集落接种到包括氨苄青霉素的LB肉汤培养基然后在37℃生长过夜。通过离心收集细胞并用洗涤剂(Bugbuster，Novagen)溶解。包涵体广泛洗涤并重溶入6M胍盐中。

该过程产生95％以上纯度的蜜蜂蛋白混合物和50％以上纯度的草蜻蛉MalF1蛋白混合物。通常可获得达到50％产量的湿重大肠杆菌细胞片状沉淀，表明通过这种方法可容易的表达该蛋白。

溶解的蜜蜂重组蛋白加到按制造商说明制备的Talon树脂柱上。然后通过100mM Tris.HCL，150mM pH 8咪唑洗脱。

实施例10-丝蛋白加工成线

蜜蜂和草蜻蛉丝蛋白通过多种方法(见图14)使用下述步骤很容易制作成线。

晚末龄意大利蜂唾液腺前段在磷酸缓冲盐溶液中分离并移到一滴缓冲液中的平面内。用镊子夹住该段的两端。一端以恒定的速率抬离缓冲液并和另一端分离。这样可以拉出很好的迅速在空气中固化的线。

蜜蜂和草蜻蛉幼虫重组丝蛋白脱水或浓缩后形成线或片层。例如，通过将可溶蛋白滴入丁醇溶液中或通过在Talon树脂柱上浓缩。

线的获得也可通过蜜蜂或草蜻蛉重组丝蛋白和有机溶剂(如己烷)混合以在界面上以正确的构象浓缩，然后加入试剂从界面上排除(如丁醇)。通过这一过程形成的线与土丝具有相似的FT-IR光谱，表明它们包括相同的卷曲螺旋结构。

此处描述的其他物种的丝蛋白也可通过这一程序加工。

本领域技术人员应理解本发明可进行许多改变和/或修饰，如具体实施方式中所示的，而并不脱离本发明的精神或范围，如此处广泛描述的。因此，本实施方式应全面理解，作为说明而不是限制。

所有上述讨论的出版物都完整的并入此处。

本说明书包括的任何所讨论的文件、文字记录、材料、装置、物品之类的目的仅是提供本发明的上下文环境。并不因为其存在于本申请每项权利要求的优先权日之前而被当作承认这些事项的任何一项构成现有技术基础的部分或本发明相关领域的公知常识。

参考文献

Atkins E.D.T.(1967)J Mol Biol 24：139-141.

Bendtsen J.D.，Nielsen H.，von Heijne G.and Brunak S.(2004)J.Mol.Biol.340：783-795.

Bini E.，Knight D.P.and Kaplan D.L.(2004)J.Mol.Biol.335：27-40.

Craig C.L.and Riekel C.(2002)Comparative Biochemistry and Physiology Part B133：493-507.

Delorenzi M.and Speed T.(2002)Bioinformatics 18：617-625.

Deng Y.，Liu J.，Zheng Q.，Eliezer D.，Kallenbach N.R.and Lu M.(2006)Structure14：247-255.

Flower N.E.and Kenchington W.R.(1967)Journal of the Royal Microscopical Society86：297.

Grimaldi D.and Engel M.S.(2005)Evolution of insects.Cambridge University Press，New York.

Harayama S.(1998)Trends Biotech.，16；76-82.

Heimburg T，Schunemann J.，Weber K.，and Geisler N.(1999)Biochemistry 38：12727-12734.

Hepburn H.R.，Chandler H.D.and Davidoff M.R.(1979)Insect Biochem.9：66.

Kneller D.G.，Cohen F.E.and Langridge R.(1990)J.Mol.Biol.214：171-182.

LaMunyon C.W.(1988)Psyche 95：203-209.

LaMunyon C.W.and Adams P.A.(1987)Annals of the Entomological Society ofAmerica 80：804-808.

Lucas F.Shaw J.T.B.and Smith S.G.(1960)J.Mol.Biol.2：339-349.

Lucas F.and Rudall K.M.(1967)In Comprehensive Biochemistry(Ed.Florkin M andStotz H)Vol 26B pp 475-559Elsevier Amsterdam.

Lupas A.，Van Dyke M.and Stock J.(1991)Science 252：1162-1164.

McClelland J.L.and Rumelhart D.E.(1988)Explorations in Parallel DistributedProcessing vol 13.pp 318-362.MITPress，Cambridge MA.

Needleman，S.B.and Wunsch，C.D.(1970)J.Mol.Biol.，48；443-453.

Quicke D.L.J.，Shaw M.R.，Takahashi M.and Yanechin B.(2004)Journal of NaturalHistory 38：2167-2181.

Reiser K.，McCormick，Rucker R.B.(1992)The FASEB Journal 6：2439-2449.

Rost B.and Sander C.(1993)J.Molecular Biology 232：584-599.

Rost B.，Yachdav G.and Liu J.(2004)Nucleic Acids Research 32(Web Serverissue)：W321-W326.

Rudall K.M.(1962)In Comparative Biochemistry(Ed.By Florkin M and Mason HS)Vol 4，pp.297-435.Academic Press，New York.

Rudall K.M.and Kenchington W.(1971)Annual Reviews in Entomology 16：73-96.

Silva-Zacarin E.C.M.，Silva De Moraes R.L.M.and Taboga S.R.(2003)J.Biosci.6：753-764.

Speilger P.E.(1962)Annals of the Entomological Society of America.55：69-77.

Wang M.B.，Li Z.Y.et al.(1998).Acta Hort.461：401-407.

Yamada H.，Shigesada K.，Igarashi Y.，Takasu Y.，Tsubouchi K.and Kato Y.(2004)Int.J.Wild Silkmoth and Silk 9：61-66.

序列表

<110>联邦科学工业研究组织

<120>丝蛋白

<130>504791

<150>US 60/723,766

<151>2005-10-05

<160>77

<170>PatentIn version 3.3

<210>1

<211>314

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>1

Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val Lys Gly Ser

1 5 10 15

Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg

20 25 30

Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val Leu Gln Ala

35 40 45

Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala Ala Asp Leu

50 55 60

Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser Gln Ala Ala

65 70 75 80

Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln Ala Arg Ala

85 90 95

Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser Ala Ala Lys

100 105 110

Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu Ser Thr Ala

115 120 125

Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala Glu Ala Val

130 135 140

Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala Asn Leu Ala

145 150 155 160

Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala Glu Lys Val

165 170 175

Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala Ala Ala Arg

180 185 190

Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala Thr Ala Ser

195 200 205

Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val Ala Val Leu

210 215 220

Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala Ala Ser Ser

225 230 235 240

Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn Val Glu Thr

245 250 255

Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val Val Ser Ile

260 265 270

Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser Thr Ser Trp

275 280 285

Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His Ile Asn Leu

290 295 300

Asn Asp Phe Asp Leu Lys Ser Asn Val Phe

305 310

<210>2

<211>333

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>2

Met Lys Ile Pro Val Leu Leu Ala Thr Cys Leu Tyr Leu Cys Gly Phe

1 5 10 15

Ala Ser Ala Gly Leu Glu Gly Pro Gly Asn Ser Leu Pro Glu Leu Val

20 25 30

Lys Gly Ser Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser

35 40 45

Gly Leu Arg Ala Gly Gln Val Ala Leu Ala Ser Gln Lys Asp Ala Val

50 55 60

Leu Gln Ala Gln Ala Ala Ala Ser Ala Ala Ser Glu Ala Arg Ala Ala

65 70 75 80

Ala Asp Leu Thr Ala Lys Leu Ser Gln Glu Ser Ala Ser Val Gln Ser

85 90 95

Gln Ala Ala Ala Lys Gly Lys Glu Thr Glu Glu Ala Ala Val Gly Gln

100 105 110

Ala Arg Ala Gly Leu Glu Ser Val Ser Met Ala Ala Ser Ala Thr Ser

115 120 125

Ala Ala Lys Glu Ala Ser Thr Ala Ala Lys Ala Ala Ala Ser Ala Leu

130 135 140

Ser Thr Ala Val Val Gln Ala Lys Ile Ala Glu Arg Ala Ala Lys Ala

145 150 155 160

Glu Ala Val Ala Ser Asp Glu Ala Lys Ala Lys Ala Ile Ala Ala Ala

165 170 175

Asn Leu Ala Ala Glu Ala Ser Val Ala Ala Glu Ala Ala Leu Lys Ala

180 185 190

Glu Lys Val Ala Glu Glu Ala Ile Ala Arg Ala Ala Ser Ala Lys Ala

195 200 205

Ala Ala Arg Ala Ala Ala Ala Ala Leu Ala Ser Ser Lys Glu Ala Ala

210 215 220

Thr Ala Ser Ala Arg Asn Ala Ala Glu Ser Glu Ala Arg Asn Glu Val

225 230 235 240

Ala Val Leu Ile Ala Glu Ile Asp Lys Lys Ser Arg Glu Ile Asp Ala

245 250 255

Ala Ser Ser Leu Asn Ala Arg Ala Ala Ala Lys Ala Ser Ser Arg Asn

260 265 270

Val Glu Thr Ala Thr Ile Gly Ala Asn Ile Asn Ser Ser Lys Gln Val

275 280 285

Val Ser Ile Pro Val Glu Ile Lys Lys Phe Ser Glu Pro Glu Val Ser

290 295 300

Thr Ser Trp Arg Glu Asp Glu Glu Val Thr Lys Glu Lys Lys Glu His

305 310 315 320

Ile Asn Leu Asn Asp Phe Asp Leu Lys Ser Asn Val Phe

325 330

<210>3

<211>290

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>3

Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp Ile Gln Gly

1 5 10 15

Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala Leu Gly Ser

20 25 30

Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu Asn Val Gly

35 40 45

Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser Val Ala Ala

50 55 60

Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly Ala Asn Ala

65 70 75 80

Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser

85 90 95

Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala Ala Glu Ala

100 105 110

Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala Ala Ala Lys

115 120 125

Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala Thr Glu Ala

130 135 140

Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg Ala Ala Ile

145 150 155 160

Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala Ala Ile Ala

165 170 175

Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile Ala Ala Ala

180 185 190

Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val Val Ala Leu

195 200 205

Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala Gln Ala Asn

210 215 220

Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser Gln Ala Ala

225 230 235 240

Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr

245 250 255

Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn Lys Ala Ala

260 265 270

Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His Val Ala Lys

275 280 285

Leu Glu

290

<210>4

<211>309

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>4

Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Val Trp Gly Leu

1 5 10 15

Ala Glu Gly Arg Val Ile Asn His Glu Ser Leu Lys Thr Ser Glu Asp

20 25 30

Ile Gln Gly Gly Tyr Ser Ala Gly Ile Val Gly Asp Gly Ser Asp Ala

35 40 45

Leu Gly Ser Ser Ile Glu Asn Ala Gln Lys Val Ala Arg Ala Ala Glu

50 55 60

Asn Val Gly Leu Asn Leu Glu Leu Gly Ala Gly Ala Arg Ala Ala Ser

65 70 75 80

Val Ala Ala Ala Ala Gln Ala Lys Asn Thr Glu Ala Ala Glu Ala Gly

85 90 95

Ala Asn Ala Ala Leu Ala Ala Ala Ile Ala Lys Arg Glu Glu Ala Ile

100 105 110

Lys Ala Ser Glu Ile Ala Asn Gln Leu Leu Thr Asn Ala Ala Lys Ala

115 120 125

Ala Glu Ala Thr Val Ser Ala Thr Lys Arg Ala Ala Gln Leu Thr Ala

130 135 140

Ala Ala Lys Glu Ala Thr Arg Ala Ser Ala Ala Ala Ala Glu Ala Ala

145 150 155 160

Thr Glu Ala Gln Val Lys Ala Asn Ala Asp Ser Ile Ile Thr Lys Arg

165 170 175

Ala Ala Ile Ala Glu Ala Gln Ala Ala Ala Glu Ala Gln Val Lys Ala

180 185 190

Ala Ile Ala Arg Lys Ser Ala Ala Asn Phe Leu Ala Lys Ala Gln Ile

195 200 205

Ala Ala Ala Ala Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Val

210 215 220

Val Ala Leu Thr Asn Ala Glu Val Ala Val Asn Gln Ala Arg Asn Ala

225 230 235 240

Gln Ala Asn Ala Ser Thr Gln Ala Ser Met Ala Val Arg Val Asp Ser

245 250 255

Gln Ala Ala Asn Ala Glu Ala Ala Ala Val Ala Gln Ala Glu Thr Leu

260 265 270

Leu Val Thr Ala Glu Ala Val Ala Ala Ala Glu Ala Glu Val Ala Asn

275 280 285

Lys Ala Ala Thr Phe Ala Lys Gln Ile Val Asn Glu Lys Lys Ile His

290 295 300

Val Ala Lys Leu Glu

305

<210>5

<211>316

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>5

Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val Ile Ser Lys

1 5 10 15

Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser Ala Lys Arg

20 25 30

Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu Gln Ser Leu

35 40 45

Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala Ala Ala Val

50 55 60

Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu Arg Ala Ser

65 70 75 80

Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Leu Lys Asn

85 90 95

Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu Ala Ala Leu

100 105 110

Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala Asn Ala Ala

115 120 125

Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg

130 135 140

Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln Lys Arg Thr

145 150 155 160

Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg Gln Leu Gln

65 170 175

Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu Glu Val Ser

180 185 190

Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser Ser Glu Ala

195 200 205

Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser Asp Ala Asp

210 215 220

Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala Ala Lys Ile

225 230 235 240

Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala Ser Glu Asp

245 250 255

Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg Ala Asn Val

260 265 270

Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly Glu Glu Ala

275 280 285

Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu Ala Glu Val

290 295 300

Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe

305 310 315

<210>6

<211>335

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>6

Met Gln Ile Pro Thr Phe Val Ala Ile Cys Leu Leu Thr Ser Gly Leu

1 5 10 15

Val His Ala Gly Val Glu Glu Phe Lys Ser Ser Ala Thr Glu Glu Val

20 25 30

Ile Ser Lys Asn Leu Glu Val Asp Leu Leu Lys Asn Val Asp Thr Ser

35 40 45

Ala Lys Arg Arg Glu Asn Gly Ala Pro Val Leu Gly Lys Asn Thr Leu

50 55 60

Gln Ser Leu Glu Lys Ile Lys Thr Ser Ala Ser Val Asn Ala Lys Ala

65 70 75 80

Ala Ala Val Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Tyr Leu

85 90 95

Arg Ala Ser Ala Leu Ser Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala

100 105 110

Leu Lys Asn Ala Gln Gln Ala Gln Leu Asn Ala Gln Glu Lys Ser Leu

115 120 125

Ala Ala Leu Lys Ala Gln Ser Glu Glu Glu Ala Ala Ser Ala Arg Ala

130 135 140

Asn Ala Ala Thr Ala Ala Thr Gln Ser Ala Leu Glu Arg Ala Gln Ala

145 150 155 160

Ser Ser Arg Leu Ala Thr Val Ala Gln Asn Val Ala Ser Asp Leu Gln

165 170 175

Lys Arg Thr Ser Thr Lys Ala Ala Ala Glu Ala Ala Ala Thr Leu Arg

180 185 190

Gln Leu Gln Asp Ala Glu Arg Thr Lys Trp Ser Ala Asn Ala Ala Leu

195 200 205

Glu Val Ser Ala Ala Ala Ala Ala Ala Glu Thr Lys Thr Thr Ala Ser

210 215 220

Ser Glu Ala Ala Asn Ala Ala Ala Lys Lys Ala Ala Ala Ile Ala Ser

225 230 235 240

Asp Ala Asp Gly Ala Glu Arg Ser Ala Ser Thr Glu Ala Gln Ser Ala

245 250 255

Ala Lys Ile Glu Ser Val Ala Ala Ala Glu Gly Ser Ala Asn Ser Ala

260 265 270

Ser Glu Asp Ser Arg Ala Ala Gln Leu Glu Ala Ser Thr Ala Ala Arg

275 280 285

Ala Asn Val Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Gly

290 295 300

Glu Glu Ala Gly Ala Ala Ala Gln Leu Leu Ala Gln Ala Lys Ala Leu

305 310 315 320

Ala Glu Val Ser Ser Lys Ser Glu Asn Ile Glu Asp Lys Lys Phe

325 330 335

<210>7

<211>323

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>7

Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr Val

1 5 10 15

Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu Leu

20 25 30

Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly Ala

35 40 45

Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu Gly

50 55 60

Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln Ser

65 70 75 80

Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn Lys

85 90 95

Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala Thr

100 105 110

Ala Ala Ser Ser Ser Ala Leu L s Ala Ser Leu Ala Thr Glu Glu Ala

115 120 125

Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala Glu

130 135 140

Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg Ala

145 150 155 160

Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser Ala

165 170 175

Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala Ala

180 185 190

Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala Asp

195 200 205

Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala Asp

210 215 220

Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala Glu

225 230 235 240

Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln Ala

245 250 255

Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala Ala

260 265 270

Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu Mer

275 280 285

Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu Glu

290 295 300

Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu Trp

305 310 315 320

Glu Val Lys

<210>8

<211>342

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>8

Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Ile Trp Gly Leu

1 5 10 15

Ala Ser Gly Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr

20 25 30

Ser Thr Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys

35 40 45

Asp Glu Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly

50 55 60

Thr Gly Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile

65 70 75 80

Ser Leu Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala

85 90 95

Ser Gln Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu

100 105 110

Thr Asn Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala

115 120 125

Arg Ala Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr

130 135 140

Glu Glu Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala

145 150 155 160

Ala Ala Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser

165 170 175

Ala Arg Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala

180 185 190

Glu Ser Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala

195 200 205

Lys Ala Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala

210 215 220

Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala

225 230 235 240

Val Ala Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala

245 250 255

Lys Ala Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val

260 265 270

Leu Gln Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala

275 280 285

Ala Ala Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala

290 295 300

Gly Glu Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys

305 310 315 320

Lys Glu Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn

325 330 335

Glu Glu Trp Glu Val Lys

340

<210>9

<211>353

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>9

Gly Val Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys Glu Glu Ser

1 5 10 15

Tyr Glu Lys Ser Glu Ser Lys Ser Leu Lys Glu Ile Lys Glu Glu Arg

20 25 30

Ala Ser Lys Ser Lys Ser Glu Arg Leu Lys Ile Arg Glu Glu Lys Arg

35 40 45

Glu Glu Glu Glu Lys Ser Lys Ser Leu Asn Leu Val Val Val Arg Glu

50 55 60

Lys Ile Thr Lys Leu Ser Ser Trp Leu Lys Glu Glu Lys Asp Ile Ser

65 70 75 80

Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly Leu Glu Asp

85 90 95

Val Thr Asp Glu Leu Asn Ile Ala Leu Lys Ser Leu Lys Glu Gly Lys

100 105 110

Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly Ser Glu Asp Val Arg Ser

115 120 125

Leu Glu Glu Leu Asp Thr Ser Val Val Glu Leu Leu Lys Leu Ile Lys

130 135 140

Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys Asn Gly Lys

145 150 155 160

Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Ile Leu Glu Thr Cys

165 170 175

Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys Asp Lys Lys

180 185 190

Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp Leu Asp Trp

195 200 205

Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu Leu Gly Gly

210 215 220

Leu Ser Gly Leu Leu Asn Ser Leu Lys Ser Glu Lys Gly Leu Leu Gly

225 230 235 240

Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu Ile Ser Glu

245 250 255

Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser Val Asp Ser

260 265 270

Val Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser Ser Val Ser Lys

275 280 285

Val Thr Glu Leu Leu Asn Lys Gly Ile Asp Ile Gln Thr Ile Leu Asn

290 295 300

Ala Lys Asn Gly Asp Glu Phe Asp Leu Ser Gly Lys Glu Leu Lys Asn

305 310 315 320

Val Lys Gly Ile Phe Gly Leu Ile Gly Ser Leu Lys Arg Ser Leu Gly

325 330 335

Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro Leu Leu Lys

340 345 350

Leu

<210>10

<211>372

<212>PRT

<213>意大利蜂(Apis mellifera)

<400>10

Met Lys Tyr Met Leu Leu Leu Leu Ser Ile Phe Ile Cys Ala His Ile

1 5 10 15

Val Cys Ala Gly Val Asn Thr Glu Leu Lys Lys Asp Gly Glu Leu Lys

20 25 30

Glu Glu Ser Tyr Glu Lys Ser Glu Ser Lys Ser Leu Lys Glu Ile Lys

35 40 45

Glu Glu Arg Ala Ser Lys Ser Lys Ser Glu Arg Leu Lys Ile Arg Glu

50 55 60

Glu Lys Arg Glu Glu Glu Glu Lys Ser Lys Ser Leu Asn Leu Val Val

65 70 75 80

Val Arg Glu Lys Ile Thr Lys Leu Ser Ser Trp Leu Lys Glu Glu Lys

85 90 95

Asp Ile Ser Pro Leu Leu Glu Glu Lys Asn Gly Lys Gly Leu Leu Gly

100 105 110

Leu Glu Asp Val Thr Asp Glu Leu Asn Ile Ala Leu Lys Ser Leu Lys

115 120 125

Glu Gly Lys Lys Phe Asp Thr Trp Lys Phe Glu Lys Gly Ser Glu Asp

130 135 140

Val Arg Ser Leu Glu Glu Leu Asp Thr Ser Val Val Glu Leu Leu Lys

145 150 155 160

Leu Ile Lys Glu Gly Lys Thr Asp His Gly Ala Ile Asp Leu Glu Lys

165 170 175

Asn Gly Lys Val Leu Val Asp Leu Glu Lys Ile Ser Glu Asn Ile Leu

180 185 190

Glu Thr Cys Gly Ser Gln Lys Lys Thr Val Glu Val Val Asp Asp Lys

195 200 205

Asp Lys Lys Trp Asn Lys Glu Ser Gly Trp Lys Lys Asn Leu Asn Asp

210 215 220

Leu Asp Trp Lys Lys Asp Leu Asp Lys Asp Lys Val Gly Gly Gly Leu

225 230 235 240

Leu Gly Gly Leu Ser Gly Leu Leu Asn Ser Leu Lys Ser Glu Lys Gly

245 250 255

Leu Leu Gly Leu Leu Asn Lys Asn Gln Ile Glu Leu Leu Ile Pro Leu

260 265 270

Ile Ser Glu Ile Lys Lys Lys Asn Ile Asp Phe Asn Leu Phe Asp Ser

275 280 285

Val Asp Ser Val Glu Arg Asn Leu Asp Leu Lys Leu Phe Thr Ser Ser

290 295 300

Val Ser Lys Val Thr Glu Leu Leu Asn Lys Gly Ile Asp Ile Gln Thr

305 310 315 320

Ile Leu Asn Ala Lys Asn Gly Asp Glu Phe Asp Leu Ser Gly Lys Glu

325 330 335

Leu Lys Asn Val Lys Gly Ile Phe Gly Leu Ile Gly Ser Leu Lys Arg

340 345 350

Ser Leu Gly Leu Glu Asn Ile Leu Asn Leu Pro Phe Lys Arg Ile Pro

355 360 365

Leu Leu Lys Leu

370

<210>11

<211>942

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>11

ggtttggagg ggccgggcaa ctcgttgccc gagctcgtga aaggtagcgc atcggccacc 60

gcgtcgaccg ctgtgaccgc tagatcagga cttagagccg gacaagtagc tttagcttcg 120

cagaaggatg ccgtactcca agctcaagct gctgcatccg ccgcgtcaga ggcgcgcgct 180

gctgccgatc tgacggctaa acttagccaa gaatcggcat cagtgcaatc gcaggctgcc 240

gccaaaggga aggaaacgga ggaggcagct gttggtcaag ctagggctgg cctcgagtcg 300

gtgtccatgg ccgcatcagc cacatctgct gccaaagaag catcgaccgc cgccaaagcc 360

gcagcatccg cactatccac agccgtggtg caagcgaaaa tagctgagag ggcagccaaa 420

gctgaagctg ttgcctcgga cgaagccaag gccaaggcga ttgcagcagc caacttggcg 480

gctgaggcca gtgtagccgc agaagcagct ctcaaggccg agaaagtggc cgaagaagcc 540

atcgcaagag cggcctctgc aaaggctgcc gcaagagctg ctgctgccgc tctagcctcc 600

tcgaaggaag cagccacggc cagcgcaaga aacgccgcgg aatccgaggc caggaacgaa 660

gtagctgtat tgatcgccga gattgataaa aagagtaggg aaatcgacgc agccagttcg 720

cttaatgcgc gtgccgctgc caaggcaagc tccaggaacg tagaaacggc gacaatcggg 780

gccaacatca actcttcgaa acaagtcgtg tcaattccag tggaaataaa gaaattctcg 840

gagccggaag tgtcaacatc atggagagaa gatgaagagg ttacgaaaga gaagaaggag 900

cacataaatc tgaacgactt cgacttgaag agcaacgtat tt 942

<210>12

<211>999

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>12

atgaagattc cagtattgct tgcaacgtgc ctctaccttt gcggatttgc gtccgccggt 60

ttggaggggc cgggcaactc gttgcccgag ctcgtgaaag gtagcgcatc ggccaccgcg 120

tcgaccgctg tgaccgctag atcaggactt agagccggac aagtagcttt agcttcgcag 180

aaggatgccg tactccaagc tcaagctgct gcatccgccg cgtcagaggc gcgcgctgct 240

gccgatctga cggctaaact tagccaagaa tcggcatcag tgcaatcgca ggctgccgcc 300

aaagggaagg aaacggagga ggcagctgtt ggtcaagcta gggctggcct cgagtcggtg 360

tccatggccg catcagccac atctgctgcc aaagaagcat cgaccgccgc caaagccgca 420

gcatccgcac tatccacagc cgtggtgcaa gcgaaaatag ctgagagggc agccaaagct 480

gaagctgttg cctcggacga agccaaggcc aaggcgattg cagcagccaa cttggcggct 540

gaggccagtg tagccgcaga agcagctctc aaggccgaga aagtggccga agaagccatc 600

gcaagagcgg cctctgcaaa ggctgccgca agagctgctg ctgccgctct agcctcctcg 660

aaggaagcag ccacggccag cgcaagaaac gccgcggaat ccgaggccag gaacgaagta 720

gctgtattga tcgccgagat tgataaaaag agtagggaaa tcgacgcagc cagttcgctt 780

aatgcgcgtg ccgctgccaa ggcaagctcc aggaacgtag aaacggcgac aatcggggcc 840

aacatcaact cttcgaaaca agtcgtgtca attccagtgg aaataaagaa attctcggag 900

ccggaagtgt caacatcatg gagagaagat gaagaggtta cgaaagagaa gaaggagcac 960

ataaatctga acgacttcga cttgaagagc aacgtattt 999

<210>13

<211>870

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>13

cgcgtgatta atcacgagtc cctgaagacg agcgaggata ttcaaggagg atattcagca 60

ggaatagtcg gtgatggatc tgacgcgctt ggctcctcca tagaaaacgc ccaaaaagtc 120

gctcgagcgg ctgaaaacgt gggcttgaat ctggaattgg gcgcaggcgc gcgtgctgcc 180

agtgttgccg ctgctgccca ggccaaaaac acagaggctg cggaagcagg agcaaacgcc 240

gctctggccg ccgccattgc caaacgggag gaagcgatta aagccagcga gatagcaaac 300

caattgttga ccaatgcagc aaaagcggca gaagcgactg tatcggcaac gaagagggca 360

gcacaattga cggctgcagc gaaagaagca accagagctt ctgcagccgc tgctgaagct 420

gctacggagg cccaggtaaa ggctaacgcc gattcaatca tcacgaagag ggctgcgatt 480

gccgaggctc aagctgcggc ggaagctcaa gttaaggcgg caatcgccag aaaatcggca 540

gcgaattttt tggctaaggc tcaaatagcg gctgccgcgg aatccgaggc cacgaaactc 600

gcggccgaag ctgtagtggc actaacaaac gccgaagtcg ccgtgaacca ggctagaaac 660

gcacaggcaa acgcctcgac tcaagcttcc atggctgtta gggtagattc tcaagcagcg 720

aacgctgaag cagccgctgt agcgcaagcc gaaactctct tggttacggc agaagctgtc 780

gcagctgcgg aggctgaggt tgcgaacaaa gccgccacat ttgcaaaaca gatcgtcaac 840

gagaagaaaa tacatgtagc aaagttggaa 870

<210>14

<211>927

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>14

atgaagattc cagcaatatt cgtcacgtct ctgctggtct ggggattggc cgagggccgc 60

gtgattaatc acgagtccct gaagacgagc gaggatattc aaggaggata ttcagcagga 120

atagtcggtg atggatctga cgcgcttggc tcctccatag aaaacgccca aaaagtcgct 180

cgagcggctg aaaacgtggg cttgaatctg gaattgggcg caggcgcgcg tgctgccagt 240

gttgccgctg ctgcccaggc caaaaacaca gaggctgcgg aagcaggagc aaacgccgct 300

ctggccgccg ccattgccaa acgggaggaa gcgattaaag ccagcgagat agcaaaccaa 360

ttgttgacca atgcagcaaa agcggcagaa gcgactgtat cggcaacgaa gagggcagca 420

caattgacgg ctgcagcgaa agaagcaacc agagcttctg cagccgctgc tgaagctgct 480

acggaggccc aggtaaaggc taacgccgat tcaatcatca cgaagagggc tgcgattgcc 540

gaggctcaag ctgcggcgga agctcaagtt aaggcggcaa tcgccagaaa atcggcagcg 600

aattttttgg ctaaggctca aatagcggct gccgcggaat ccgaggccac gaaactcgcg 660

gccgaagctg tagtggcact aacaaacgcc gaagtcgccg tgaaccaggc tagaaacgca 720

caggcaaacg cctcgactca agcttccatg gctgttaggg tagattctca agcagcgaac 780

gctgaagcag ccgctgtagc gcaagccgaa actctcttgg ttacggcaga agctgtcgca 840

gctgcggagg ctgaggttgc gaacaaagcc gccacatttg caaaacagat cgtcaacgag 900

aagaaaatac atgtagcaaa gttggaa 927

<210>15

<211>949

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>15

ggcgtcgagg aattcaagtc ctcggcaacc gaggaggtga tcagcaaaaa cttagaagtc 60

gacctgttga aaaatgtgga cactagcgcg aaacgaagag agaacggcgc cccggtgctc 120

ggcaagaaca cacttcaatc cctggagaag atcaagacgt cggcgagcgt gaatgccaaa 180

gcagcagccg tggtgaaagc gtccgctctg gctcttgcag aggcctattt gcgagcgtcc 240

gcattgtcag ccgccgcttc agccaaggca gccgccgccc tgaaaaatgc tcaacaagcg 300

caattaaacg cccaggaaaa gtctttggcc gcgttgaaag ctcagtccga ggaagaggca 360

gcttctgctc gtgcaaacgc agcaaccgcc gcgacacagt cggcactgga acgcgctcaa 420

gcctcctcca ggttagcaac ggtcgcccaa aacgtagcca gcgacttgca gaaacggacc 480

agcaccaagg ccgcggctga agccgctgcc accctcagac aattacagga cgcggaacga 540

acgaaatgga gtgccaacgc tgccttagaa gtctccgccg ctgcagctgc cgcagaaacc 600

aagaccactg cctcctcgga ggccgccaac gccgccgcca aaaaggcggc cgcgatagct 660

tctgacgcgg acggcgcgga aaggtcggca tctaccgagg cacaatcagc tgcgaagatc 720

gagagtgtgg cagccgccga gggatccgcc aactcggcct ctgaggattc ccgggccgct 780

caattggaag cctccaccgc ggcgagagcc aacgtggccg cagctgtcgg ggatggagcg 840

attataggac ttggagagga agcgggtgcc gcggctcagt tgcttgcaca ggcgaaggca 900

ttggccgaag ttagctcgaa atccgaaaat attgaggata aaaaatttt 949

<210>16

<211>1006

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>16

atgcagatcc caacgtttgt cgccatatgc ttgctcacat cgggcttggt gcacgcaggc 60

gtcgaggaat tcaagtcctc ggcaaccgag gaggtgatca gcaaaaactt agaagtcgac 120

ctgttgaaaa atgtggacac tagcgcgaaa cgaagagaga acggcgcccc ggtgctcggc 180

aagaacacac ttcaatccct ggagaagatc aagacgtcgg cgagcgtgaa tgccaaagca 240

gcagccgtgg tgaaagcgtc cgctctggct cttgcagagg cctatttgcg agcgtccgca 300

ttgtcagccg ccgcttcagc caaggcagcc gccgccctga aaaatgctca acaagcgcaa 360

ttaaacgccc aggaaaagtc tttggccgcg ttgaaagctc agtccgagga agaggcagct 420

tctgctcgtg caaacgcagc aaccgccgcg acacagtcgg cactggaacg cgctcaagcc 480

tcctccaggt tagcaacggt cgcccaaaac gtagccagcg acttgcagaa acggaccagc 540

accaaggccg cggctgaagc cgctgccacc ctcagacaat tacaggacgc ggaacgaacg 600

aaatggagtg ccaacgctgc cttagaagtc tccgccgctg cagctgccgc agaaaccaag 660

accactgcct cctcggaggc cgccaacgcc gccgccaaaa aggcggccgc gatagcttct 720

gacgcggacg gcgcggaaag gtcggcatct accgaggcac aatcagctgc gaagatcgag 780

agtgtggcag ccgccgaggg atccgccaac tcggcctctg aggattcccg ggccgctcaa 840

ttggaagcct ccaccgcggc gagagccaac gtggccgcag ctgtcgggga tggagcgatt 900

ataggacttg gagaggaagc gggtgccgcg gctcagttgc ttgcacaggc gaaggcattg 960

gccgaagtta gctcgaaatc cgaaaatatt gaggataaaa aatttt 1006

<210>17

<211>969

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>17

gcaagggaag aggtggagac acgggacaag accaagacct cgacagtggt gaaaagcgag 60

aaagtggaag tcgttgctcc cgctaaggat gaacttaaat taacgagcga gcctatcttt 120

ggaagaagag tgggaactgg agcatccgag gtggcatcta gcagcggtga agccatcgcg 180

ataagtcttg gagcagggca gtcagcggca gagtctcagg ccttggccgc ctcgcaatcc 240

aaaacggcag cgaacgccgc cataggcgcg agcgagctta ccaacaaagt tgctgctcta 300

gttgctggcg cgactggtgc gcaggcgaga gctacggccg cctcctcgag cgcgttgaag 360

gccagcttgg cgaccgaaga agcggcggaa gaggccgagg cggccgtggc tgacgccaag 420

gctgccgcgg aaaaggccga atccctggcg aaaaatctcg cgtcggcgag cgctcgcgcg 480

gccctctcct ccgaaagggc gaacgaattg gctcaagctg agagcgctgc agcggccgag 540

gcgcaggcca agacagcagc cgccgccaaa gcagcggaaa tcgcccttaa ggtcgctgag 600

atagcggtga aggcggaagc ggacgcagca gctgccgccg tggcagctgc aaaggcaaga 660

gccgtggcag acgcggccgc tgcccgtgcc gcagccgtga acgccatcgc caaggcggaa 720

gaggaggcct cggcccaagc agagaacgcc gccggtgttt tgcaagcagc cgcctccgcc 780

gcggcggaat cgcgagccgc tgcagctgcc gccgctgcta cctcggaggc agcggctgaa 840

gctggcccgt tggcaggtga gatgaaacca ccgcactgga aatgggaacg gattcctgtg 900

aagaaggagg agtggaaaac gtcaacgaag gaagaatgga aaacgacgaa tgaagaatgg 960

gaggtgaag 969

<210>18

<211>1026

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>18

atgaagatcc catccatact cgcggtttcc ctgctgatct ggggtttggc aagcggcgca 60

agggaagagg tggagacacg ggacaagacc aagacctcga cagtggtgaa aagcgagaaa 120

gtggaagtcg ttgctcccgc taaggatgaa cttaaattaa cgagcgagcc tatctttgga 180

agaagagtgg gaactggagc atccgaggtg gcatctagca gcggtgaagc catcgcgata 240

agtcttggag cagggcagtc agcggcagag tctcaggcct tggccgcctc gcaatccaaa 300

acggcagcga acgccgccat aggcgcgagc gagcttacca acaaagttgc tgctctagtt 360

gctggcgcga ctggtgcgca ggcgagagct acggccgcct cctcgagcgc gttgaaggcc 420

agcttggcga ccgaagaagc ggcggaagag gccgaggcgg ccgtggctga cgccaaggct 480

gccgcggaaa aggccgaatc cctggcgaaa aatctcgcgt cggcgagcgc tcgcgcggcc 540

ctctcctccg aaagggcgaa cgaattggct caagctgaga gcgctgcagc ggccgaggcg 600

caggccaaga cagcagccgc cgccaaagca gcggaaatcg cccttaaggt cgctgagata 660

gcggtgaagg cggaagcgga cgcagcagct gccgccgtgg cagctgcaaa ggcaagagcc 720

gtggcagacg cggccgctgc ccgtgccgca gccgtgaacg ccatcgccaa ggcggaagag 780

gaggcctcgg cccaagcaga gaacgccgcc ggtgttttgc aagcagccgc ctccgccgcg 840

gcggaatcgc gagccgctgc agctgccgcc gctgctacct cggaggcagc ggctgaagct 900

ggcccgttgg caggtgagat gaaaccaccg cactggaaat gggaacggat tcctgtgaag 960

aaggaggagt ggaaaacgtc aacgaaggaa gaatggaaaa cgacgaatga agaatgggag 1020

gtgaag 1026

<210>19

<211>1059

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>19

ggcgtaaata cagaattaaa aaaagatggt gaactaaagg aagagtctta tgagaaaagc 60

gagtcaaaga gtttaaaaga aattaaagaa gaacgtgctt caaaatcaaa aagtgaacgt 120

ttgaagattc gtgaagaaaa acgcgaagag gaagaaaaat ccaagagtct gaatctggtc 180

gtggtcagag aaaagattac caaactttct tcatggctca aagaagagaa agatatcagt 240

cctcttttgg aagaaaaaaa tggcaaaggt ctattgggtt tggaagatgt cacggacgag 300

ttaaatatcg ctcttaaatc gttgaaggag ggcaaaaagt ttgatacttg gaaattcgag 360

aaaggtagcg aagacgttcg ttctttggaa gaacttgata cgagcgtcgt tgaactttta 420

aaattaataa aggaaggaaa aactgaccat ggtgctatag atttggagaa gaatggtaag 480

gtacttgtag atttggaaaa aatctcagaa aacatacttg aaacttgtgg atcacaaaag 540

aagactgtgg aagttgtaga tgataaagac aaaaaatgga ataaagaatc aggttggaaa 600

aaaaatctaa atgatctaga ttggaaaaaa gatttagata aagataaagt tggtggcggt 660

ttgcttggcg gtttaagtgg cctcttaaat agtttaaaat cagaaaaagg tcttctaggt 720

cttttgaata agaatcaaat tgagttatta attcctttaa tcagtgagat aaaaaagaaa 780

aatatagatt ttaatctctt cgattctgtt gattctgtcg aaagaaattt agacttgaaa 840

cttttcacaa gttctgtttc aaaagttact gaattattaa ataaaggaat cgatattcaa 900

acaattttga atgcgaaaaa tggagatgaa ttcgatttaa gcggcaaaga attgaaaaac 960

gtcaaaggga tatttggttt gattggaagt ttgaaacgct cattaggatt agaaaatata 1020

ttgaacttac cgtttaaacg tatacctctg cttaaatta 1059

<210>20

<211>1116

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>20

atgaaataca tgctcttgtt gctatctata ttcatctgtg cacatattgt atgcgcaggc 60

gtaaatacag aattaaaaaa agatggtgaa ctaaaggaag agtcttatga gaaaagcgag 120

tcaaagagtt taaaagaaat taaagaagaa cgtgcttcaa aatcaaaaag tgaacgtttg 180

aagattcgtg aagaaaaacg cgaagaggaa gaaaaatcca agagtctgaa tctggtcgtg 240

gtcagagaaa agattaccaa actttcttca tggctcaaag aagagaaaga tatcagtcct 300

cttttggaag aaaaaaatgg caaaggtcta ttgggtttgg aagatgtcac ggacgagtta 360

aatatcgctc ttaaatcgtt gaaggagggc aaaaagtttg atacttggaa attcgagaaa 420

ggtagcgaag acgttcgttc tttggaagaa cttgatacga gcgtcgttga acttttaaaa 480

ttaataaagg aaggaaaaac tgaccatggt gctatagatt tggagaagaa tggtaaggta 540

cttgtagatt tggaaaaaat ctcagaaaac atacttgaaa cttgtggatc acaaaagaag 600

actgtggaag ttgtagatga taaagacaaa aaatggaata aagaatcagg ttggaaaaaa 660

aatctaaatg atctagattg gaaaaaagat ttagataaag ataaagttgg tggcggtttg 720

cttggcggtt taagtggcct cttaaatagt ttaaaatcag aaaaaggtct tctaggtctt 780

ttgaataaga atcaaattga gttattaatt cctttaatca gtgagataaa aaagaaaaat 840

atagatttta atctcttcga ttctgttgat tctgtcgaaa gaaatttaga cttgaaactt 900

ttcacaagtt ctgtttcaaa agttactgaa ttattaaata aaggaatcga tattcaaaca 960

attttgaatg cgaaaaatgg agatgaattc gatttaagcg gcaaagaatt gaaaaacgtc 1020

aaagggatat ttggtttgat tggaagtttg aaacgctcat taggattaga aaatatattg 1080

aacttaccgt ttaaacgtat acctctgctt aaatta 1116

<210>21

<211>1660

<212>DNA

<213>意大利蜂(Apis mellifera)

<400>21

atgaaataca tgctcttgtt gctatctata ttcatctgtg cacatattgt atgcgcaggc 60

gtaaatacag aattaaaaaa agatggtgaa ctaaaggaag agtcttatga gaaaagcgag 120

tcaaagagtt taaaagaaat taaagaagaa cgtgcttcaa aatcaaaaag tgaacgtttg 180

aagattcgtg aaggtaattc gtgagattca agattcaaat caattaaatt tgaaaattat 240

gaaagtagta ttgttaaatt ataagataga agattttatc taaaaaataa taaattaagc 300

tttttgtatt tttggatatt gtagatattt ttaatataga attcttataa agttaaaaaa 360

tattttataa attaaacaac tttttattat ttttatgatc taaaaattaa aaatttcaag 420

ttaaagttca aattaaaaat ttgtaaaaaa tatggaaaaa acataaaaat tgaatttgtt 480

gtaatttaaa aaggattttt attatttatt gattaattat gaatataagt tcgaaaaatc 540

ctaaatatta atgtttaaaa ttttaattct taacaaaata tatttaattt aattcttaac 600

aaagatacat ttaaagaatt tcgcaaattt aaaaattagg tttttaattt taagaatcaa 660

atggtaaaaa acattttaaa tttgaaatat ataaaagtaa atcttttaat cgacaaacgg 720

atgaatttat tgattagaaa aacgcgaaga ggaagaaaaa tccaagagtc tgaatctggt 780

cgtggtcaga gaaaagatta ccaaactttc ttcatggctc aaagaagaga aagatatcag 840

tcctcttttg gaagaaaaaa atggcaaagg tctattgggt ttggaagatg tcacggacga 900

gttaaatatc gctcttaaat cgttgaagga gggcaaaaag tttgatactt ggaaattcga 960

gaaaggtagc gaagacgttc gttctttgga agaacttgat acgagcgtcg ttgaactttt 1020

aaaattaata aaggaaggaa aaactgacca tggtgctata gatttggaga agaatggtaa 1080

ggtacttgta gatttggaaa aaatctcaga aaacatactt gaaacttgtg gatcacaaaa 1140

gaagactgtg gaagttgtag atgataaaga caaaaaatgg aataaagaat caggttggaa 1200

aaaaaatcta aatgatctag attggaaaaa agatttagat aaagataaag ttggtggcgg 1260

tttgcttggc ggtttaagtg gcctcttaaa tagtttaaaa tcagaaaaag gtcttctagg 1320

tcttttgaat aagaatcaaa ttgagttatt aattccttta atcagtgaga taaaaaagaa 1380

aaatatagat tttaatctct tcgattctgt tgattctgtc gaaagaaatt tagacttgaa 1440

acttttcaca agttctgttt caaaagttac tgaattatta aataaaggaa tcgatattca 1500

aacaattttg aatgcgaaaa atggagatga attcgattta agcggcaaag aattgaaaaa 1560

cgtcaaaggg atatttggtt tgattggaag tttgaaacgc tcattaggat tagaaaatat 1620

attgaactta ccgtttaaac gtatacctct gcttaaatta 1660

<210>22

<211>308

<212>PRT

<213>授粉熊蜂(Bombus terrestris)

<400>22

Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser Ala Ser Ala

1 5 10 15

Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg Ala Gly Gln

20 25 30

Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala Asp Ala Ser

35 40 45

Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln Ser Ala Ser

50 55 60

Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala Ala Arg Ala

65 70 75 80

Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala Glu Leu Gln

85 90 95

Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg Glu Ala Ala

100 105 110

Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala Ala Val Gln

115 120 125

Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu Ala Ser Glu

130 135 140

Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala

145 150 155 160

Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile Ala Glu Glu

165 170 175

Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg Ala Ala Ala

180 185 190

Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser Ala Arg Ser

195 200 205

Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu Ile Ser Glu

210 215 220

Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser Ala Lys Ala

225 230 235 240

Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr Ala Val Ile

245 250 255

Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile Pro Ile Glu

260 265 270

Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu Glu Asn Val

275 280 285

Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr Ser Ser Glu

290 295 300

Ala Trp Ser Ile

305

<210>23

<211>327

<212>PRT

<213>授粉熊蜂(Bombus terrestris)

<400>23

Met Lys Ile Pro Ala Leu Leu Val Thr Cys Leu Tyr Leu Trp Gly Phe

1 5 10 15

Ala Ser Ala Gly Gln Ser Ser Pro Leu Leu Glu Ile Val Gln Gly Ser

20 25 30

Ala Ser Ala Thr Ala Ser Thr Ala Val Thr Ala Arg Ser Gly Leu Arg

35 40 45

Ala Gly Gln Val Ala Val Ala Ser Gln Lys Asp Ala Thr Leu Gln Ala

50 55 60

Asp Ala Ser Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Ala Asp Gln

65 70 75 80

Ser Ala Ser Leu Ala Gln Gln Ser Ala Ser Leu Gln Ser Lys Ala Ala

85 90 95

Ala Arg Ala Lys Ser Ala Glu Glu Ser Ala Ala Ala Thr Ala Lys Ala

100 105 110

Glu Leu Gln Ala Glu Ser Ile Ala Ala Ser Ala Ser Ser Asn Ala Arg

115 120 125

Glu Ala Ala Ala Ser Ala Lys Ala Ser Ala Ser Ala Met Ser Ser Ala

130 135 140

Ala Val Gln Ala Lys Leu Ala Glu Lys Thr Ala Lys Asn Gln Ala Leu

145 150 155 160

Ala Ser Glu Glu Ala Lys Leu Lys Ala Ala Ala Ala Ala Ser Ala Ala

165 170 175

Ala Ala Ala Ser Ala Ala Ala Glu Ala Ala Leu Lys Ala Glu Arg Ile

180 185 190

Ala Glu Glu Ala Ile Ala Lys Ala Ala Ala Ala Lys Ala Ala Ala Arg

195 200 205

Ala Ala Ala Ala Ala Leu Asn Ser Ala Lys Glu Ala Ala Thr Ser Ser

210 215 220

Ala Arg Ser Ala Ala Glu Ala Glu Ala Lys Ser Glu Val Ala Ile Leu

225 230 235 240

Ile Ser Glu Leu Asp Lys Lys Ser Arg Glu Val Ala Ala Ser Ala Ser

245 250 255

Ala Lys Ala Arg Ala Ala Ala Ala Ala Ser Ser Arg Asn Ala Glu Thr

260 265 270

Ala Val Ile Gly Ala Asn Ile Asn Val Ala Lys Glu Val Leu Ala Ile

275 280 285

Pro Ile Glu Pro Lys Lys Leu Pro Glu Pro Glu Leu Ala Leu Lys Glu

290 295 300

Glu Asn Val Ala Val Ala Ser Ser Glu Ser Glu Val Lys Val Glu Thr

305 310 315 320

Ser Ser Glu Ala Trp Ser Ile

325

<210>24

<211>293

<212>PRT

<213>授粉熊蜂(Bombus rerrestris)

<400>24

His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro Ala Leu Pro Glu

1 5 10 15

Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser Met Glu Asn Gly

20 25 30

Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu Arg Thr Glu Leu

35 40 45

Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr Lys Gln Ala Lys

50 55 60

Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala Ile Ala Ile Ala

65 70 75 80

Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu Leu Ala Ser Lys

85 90 95

Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala Val Ser Ala Thr

100 105 110

Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala Ala Ala Lys Ala

115 120 125

Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln Val Arg Ala Asn

130 135 140

Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala Glu Ala Lys Ala

145 150 155 160

Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys Lys Ala Ala Ala

165 170 175

Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala Glu Ser Glu Ala

180 185 190

Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala Lys Ala Arg Val

195 200 205

Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala Thr Ala Gln Ala

210 215 220

Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn Ala Glu Ala Ser

225 230 235 240

Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala Glu Ala Val Ser

245 250 255

Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser Trp Gly Glu Glu

260 265 270

Cys His Gln Arg Glu Lys Val Thr Phe Ser Glu Asp Arg Leu Asn Glu

275 280 285

Arg Gln Asp Asn Trp

290

<210>25

<211>313

<212>PRT

<213>授粉熊蜂(Bombus terrestris)

<400>25

Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Val Trp Gly Gly

1 5 10 15

Leu Ala Glu Gly His Val Val Lys Arg Asp Lys Glu Leu Lys Ala Pro

20 25 30

Ala Leu Pro Glu Leu Leu Gly Asp Gly Ser Asp Thr Leu Gly Ala Ser

35 40 45

Met Glu Asn Gly Ile Lys Val Ala Arg Ala Ser Gln Asn Val Gly Leu

50 55 60

Arg Thr Glu Leu Asn Ala Ala Ala Arg Ala Ala Ala Ala Ala Ala Thr

65 70 75 80

Lys Gln Ala Lys Asp Thr Glu Ala Ala Glu Ala Gly Ala Ala Ala Ala

85 90 95

Ile Ala Ile Ala Ile Ala Lys Arg Glu Glu Ala Ile Lys Ala Ser Glu

100 105 110

Leu Ala Ser Lys Leu Leu Thr Ala Ala Ala Gly Ser Ser Glu Ala Ala

115 120 125

Val Ser Ala Thr Val Arg Ala Ala Gln Leu Thr Ala Ala Ala Ser Ala

130 135 140

Ala Ala Lys Ala Ser Ala Ser Ala Ser Glu Ala Ser Ala Glu Ala Gln

145 150 155 160

Val Arg Ala Asn Ala Glu Ala Asn Ile Ala Lys Lys Ala Ser Ala Ala

165 170 175

Glu Ala Lys Ala Ala Ala Glu Ala Gln Val Lys Ala Glu Leu Ala Lys

180 185 190

Lys Ala Ala Ala Gly Phe Leu Ala Lys Ala Arg Leu Ala Ala Ser Ala

195 200 205

Glu Ser Glu Ala Thr Lys Leu Ala Ala Glu Ala Glu Val Ala Leu Ala

210 215 220

Lys Ala Arg Val Ala Val Asp Gln Ser Gln Ser Ala Gln Ala Thr Ala

225 230 235 240

Thr Ala Gln Ala Ala Thr Ala Val Gln Leu Gln Ser Gln Ala Ala Asn

245 250 255

Ala Glu Ala Ser Ala Val Ala Gln Ala Glu Thr Leu Leu Val Thr Ala

260 265 270

Glu Ala Val Ser Ala Ala Glu Ala Glu Ala Ala Thr Lys Ala Thr Ser

275 280 285

Trp Gly Glu Glu Cys His Gln Arg Glu Lys ValThr Phe Ser Glu Asp

290 295 300

Arg Leu Asn Glu Arg Gln Asp Asn Trp

305 310

<210>26

<211>313

<212>PRT

<213>授粉熊蜂(Bombus terrestris)

<400>26

Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val Leu Val Glu

1 5 10 15

Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg Lys Glu Asn

20 25 30

Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu Ala Ser Thr

35 40 45

Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys Val Lys Ala

50 55 60

Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser Ala Ala Phe

65 70 75 80

Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu Ala Thr Gln

85 90 95

Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu Lys Thr Gln

100 105 110

Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala Ala Ala Ala

115 120 125

Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg Ala Ala Thr

130 135 140

Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val Ala Thr Ser

145 150 155 160

Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln Ser Ala Ala

165 170 175

Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala Ala Ala Ala

180 185 190

Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser Thr Ala Ala

195 200 205

Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser Ser Ala Glu

210 215 220

Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile Ala Gly Thr

225 230 235 240

Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn Ser Arg Thr

245 250 255

Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala Ala Ala Ala

260 265 270

Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala Ser Ala Ala

275 280 285

Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala Ser Ala Ser

290 295 300

Leu Gly Ala Ser Glu Lys Asp Lys Lys

305 310

<210>27

<211>332

<212>PRT

<213>授粉熊蜂(Bombus terrestris)

<400>27

Met Gln Ile Pro Ala Ile Phe Val Thr Cys Leu Leu Thr Trp Gly Leu

1 5 10 15

Val His Ala Gly Ser Val Glu Leu Gly Ala Pro Lys Gln Glu Ser Val

20 25 30

Leu Val Glu Gln Leu Leu Leu Lys Asn Val Glu Thr Ser Ala Lys Arg

35 40 45

Lys Glu Asn Gly Ala Pro Lys Leu Gly Glu Ser Thr Ala Ala Ala Leu

50 55 60

Ala Ser Thr Lys Ala Thr Ala Ala Ala Glu Ala Lys Ala Ser Ala Lys

65 70 75 80

Val Lys Ala Ser Ala Leu Ala Leu Ala Glu Ala Phe Leu Arg Ala Ser

85 90 95

Ala Ala Phe Ala Ala Ala Ser Ala Lys Ala Ala Ala Ala Val Lys Glu

100 105 110

Ala Thr Gln Ala Gln Leu Leu Ala Gln Glu Lys Ala Leu Ile Ala Leu

115 120 125

Lys Thr Gln Ser Glu Gln Gln Ala Ala Ser Ala Arg Ala Asp Ala Ala

130 135 140

Ala Ala Ala Ala Val Ser Ala Leu Glu Arg Ala Gln Ala Ser Ser Arg

145 150 155 160

Ala Ala Thr Thr Ala Gln Asp Ile Ser Ser Asp Leu Glu Lys Arg Val

165 170 175

Ala Thr Ser Ala Ala Ala Glu Ala Gly Ala Thr Leu Arg Ala Glu Gln

180 185 190

Ser Ala Ala Gln Ser Lys Trp Ser Ala Ala Leu Ala Ala Gln Thr Ala

195 200 205

Ala Ala Ala Ala Ala Ile Glu Ala Lys Ala Thr Ala Ser Ser Glu Ser

210 215 220

Thr Ala Ala Ala Thr Ser Lys Ala Ala Val Leu Thr Ala Asp Thr Ser

225 230 235 240

Ser Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ser Ala Ser Arg Ile

245 250 255

Ala Gly Thr Ala Ala Thr Glu Gly Ser Ala Asn Trp Ala Ser Glu Asn

260 265 270

Ser Arg Thr Ala Gln Leu Glu Ala Ser Ala Ser Ala Lys Ala Thr Ala

275 280 285

Ala Ala Ala Val Gly Asp Gly Ala Ile Ile Gly Leu Ala Arg Asp Ala

290 295 300

Ser Ala Ala Ala Gln Ala Ala Ala Glu Val Lys Ala Leu Ala Glu Ala

305 310 315 320

Ser Ala Ser Leu Gly Ala Ser Glu Lys Asp Lys Lys

325 330

<210>28

<211>338

<212>PRT

<213>授粉熊蜂(Bombus terrestris)

<400>28

Gly Lys Pro Leu Ile Ala Asn Ala Gln Ile Gly Lys Val Lys Thr Glu

1 5 10 15

Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly Ser Gln Thr

20 25 30

Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu Ala Leu Ala

35 40 45

Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala Ser Val Thr

50 55 60

Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr Gly Lys Lys

65 70 75 80

Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly Glu Ala Ile

85 90 95

Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala

100 105 110

Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala Asn Ala Gly

115 120 125

Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala Ala Ala Ala

130 135 140

Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys Ala Ser Leu

145 150 155 160

Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala ValAla Leu Ala

165 170 175

Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr Ala Ala Ala

180 185 190

Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn Glu Leu Ala

195 200 205

Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys Ala Ala Ala

210 215 220

Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu Thr Ala Val

225 230 235 240

Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala

245 250 255

Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala Val Asn Ala

260 265 270

Ile Ala Glu Ala Glu Glu Arg As Ser Ala Gln Ala Glu Asn Thr Ala

275 280 285

Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln Asp Ser Cys

290 295 300

Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr Ala Trp Trp

305 310 315 320

Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro Arg Asn Arg

325 330 335

Arg Thr

<210>29

<211>357

<212>PRT

<213>授粉熊蜂(Bombus terrestris)

<400>29

Met Lys Ile Pro Ser Ile Leu Ala Val Ser Leu Leu Val Trp Gly Leu

1 5 10 15

Ala Ser Ala Gly Lys Pro Leu Ile Ala Ash Ala Gln Ile Gly Lys Val

20 25 30

Lys Thr Glu Thr Ser Ser Ser Ser Glu Ile Glu Thr Leu Val Ser Gly

35 40 45

Ser Gln Thr Leu Val Ala Gly Ser Glu Thr Leu Ala Ser Glu Ser Glu

50 55 60

Ala Leu Ala Ser Lys Ser Glu Ala Leu Thr Ser Glu Ala Glu Ile Ala

65 70 75 80

Ser Val Thr Thr Lys Asp Glu Leu Ile Leu Lys Gly Glu Ala Ile Thr

85 90 95

Gly Lys Lys Leu Gly Thr Gly Ala Ser Glu Val Ala Ala Ala Ser Gly

100 105 110

Glu Ala Ile Ala Thr Thr Leu Gly Ala Gly Gln Ala Ala Ala Glu Ala

115 120 125

Gln Ala Ala Ala Ala Ala Gln Ala Lys Ser Ala Ala Ala Ala Ala Ala

130 135 140

Asn Ala Gly Glu Ser Ser Asn Ser Ala Ala Ala Leu Val Ala Ala Ala

145 150 155 160

Ala Ala Ala Gln Gly Lys Ala Ala Ala Ala Ala Ala Ala Ala Thr Lys

165 170 175

Ala Ser Leu Glu Ala Ala Asp Ala Ala Glu Glu Ala Glu Ser Ala Val

180 185 190

Ala Leu Ala Arg Ala Ala Ser Ala Lys Ala Glu Ala Leu Ala Ser Thr

195 200 205

Ala Ala Ala Ala Asn Thr Arg Ala Ala Leu Gln Ala Glu Lys Ser Asn

210 215 220

Glu Leu Ala Gln Ala Glu Ala Ala Ala Ala Ala Glu Ala Gln Ala Lys

225 230 235 240

Ala Ala Ala Ala Ala Lys Ala Thr Gln Leu Ala Leu Lys Val Ala Glu

245 250 255

Thr Ala Val Lys Thr Glu Ala Asp Ala Ala Ala Ala Ala Val Ala Ala

260 265 270

Ala Lys Ala Arg Ala Val Ala Asp Ala Ala Ala Ser Arg Ala Thr Ala

275 280 285

Val Asn Ala Ile Ala Glu Ala Glu Glu Arg Asp Ser Ala Gln Ala Glu

290 295 300

Asn Thr Ala Gly Val Ala Gln Ala Ala Leu Ala Ala Ala Glu Ala Gln

305 310 315 320

Asp Ser Cys Ile Gly Ala Ala Ala Thr Pro Arg His Ser Ser Ser Tyr

325 330 335

Ala Trp Trp Lys Leu Arg Ile Thr Ser Leu Ile Val Ile Leu Ser Pro

340 345 350

Arg Asn Arg Arg Thr

355

<210>30

<211>422

<212>PRT

<213>授粉熊蜂(Bombus terrestris)

<400>30

Gly Asn Ser Glu Ser Gly Glu Asn Trp Lys Asn Gly Glu Ser Ser Glu

1 5 10 15

Ser Gly Lys Asn Trp Arg Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn

20 25 30

Trp Lys Asn Gly Gly Ser Ser Glu Ser Asn Lys His Trp Lys Asn Gly

35 40 45

Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Ser Glu

50 55 60

Ser Gly Lys Asn Trp Lys Asn Ser Gly Ser Ser Glu Ser Gly Lys Asn

65 70 75 80

Trp Lys Asn Gly Gly Ser Ser Glu Ser Asn Lys His Trp Lys Ser Gly

85 90 95

Gly Ser Ser Glu Ser Gly Glu Lys Trp Lys Asn Ser Glu Ser Gly Asn

100 105 110

Lys Gly Lys Ser Ser Lys Ser Ser Glu Ser Trp Lys Ser Asn Glu Asn

115 120 125

Ser Lys Asn Asp Gly Ser Trp Lys Ser Ser Glu Glu Ser Glu Lys Trp

130 135 140

Lys Asp Gly Lys Ala Val Ala Glu Asp Ser Val Ser Ile Asn Trp Ala

145 150 155 160

Asp Val Lys Glu Gln Ile Ser Asn Ile Ala Thr Ser Leu Glu Lys Gly

165 170 175

Gly Asn Leu Glu Ala Val Leu Lys Ile Lys Lys Gly Glu Lys Lys Ile

180 185 190

Ser Ser Leu Glu Glu Ile Lys Glu Lys Ile Ser Val Leu Leu Lys Trp

195 200 205

Ile Gln Glu Gly Lys Asp Thr Ser Ser Leu Leu Asp Leu Lys Glu Gly

210 215 220

Ser Lys Asp Ile Ala Ser Leu Lys Glu Ile Lys Gly Lys Ile Leu Leu

225 230 235 240

Ile Val Lys Leu Val Asn Glu Gly Lys Asp Thr Ser Gly Leu Leu Asp

245 250 255

Leu Glu Ala Ser Gly Lys Val Ile Leu Glu Leu Gln Ser Ala Ile Glu

260 265 270

Lys Val Leu Val Lys Ser Glu Lys Val Thr Lys Val Ser Glu Val Ser

275 280 285

Gly Leu Val Lys Ser Lys Thr Val Ser Asp Ile Lys Pro Leu Gln Ala

290 295 300

Val Ile Pro Leu Ile Leu Glu Leu Gln Lys Thr Asp Ile Asn Leu Ser

305 310 315 320

Thr Leu Asn Lys Trp Ser Thr Val Asn Val Asn Ser Ile Asp Lys Glu

325 330 335

Arg Val Thr Lys Thr Val Pro Val Leu Leu Gln Ser Met Lys Gly Gly

340 345 350

Glu Asp Ile Gln Asn Leu Leu Ser Ala Lys Gly Ala Lys Lys Leu Gly

355 360 365

Ile Ser Ala Leu Asp Leu Gln Ala Val Gln Gly Ala Leu Gly Val Val

370 375 380

Gly Lys Leu Ser Ser Gly Gly Ala Leu Asn Ser Lys Gly Leu Leu Asn

385 390 395 400

Leu Lys Asp Gly Ala Ser Val Leu Gly Ala Gly Lys Ile Gly Gly Leu

405 410 415

Ile Pro Leu Pro Lys Leu

420

<210>31

<211>927

<212>DNA

<213>授粉熊蜂(Bombus terrestris)

<400>31

ggccagagct cacctctgct cgagatcgtg cagggtagcg cgtcggccac cgcatccacc 60

gctgtgaccg ctagatccgg acttcgtgcc ggtcaggtag ccgtggcctc gcagaaggat 120

gccacacttc aggcagatgc ctcagcggcc gccgcggccg ctgcacgcgc ttccgccgac 180

cagtcggcca gtctagccca acagtcggcg tctttgcagt ccaaagctgc cgccagagca 240

aaatcagccg aggagtcagc ggcagctacg gccaaagccg agttgcaggc agaatccatt 300

gctgcatctg ccagttccaa tgccagagag gctgcagcgt ccgcaaaagc ctccgcatcc 360

gcgatgtcat cggctgccgt gcaggcgaaa ctcgctgaaa agacggccaa gaatcaagct 420

ctggcttccg aagaagccaa actcaaggct gccgccgctg ccagcgcagc agcagcagcc 480

agcgccgccg ccgaggcagc cctgaaagct gagagaatag cggaagaagc catcgccaag 540

gcggccgctg ccaaagcagc cgccagagcc gctgcagccg cgttaaactc cgcgaaggaa 600

gccgccacga gcagcgcaag gagcgccgcc gaagccgaag ctaagagcga agtcgctata 660

ctgatcagcg aactcgacaa gaagagcagg gaagtcgccg cttccgcgtc cgccaaggca 720

cgcgctgctg ctgcggctag ctccagaaac gcagaaacgg ctgttatcgg agctaacatc 780

aatgtggcca aagaggtctt ggcgattccc atcgagccaa agaaacttcc ggagccagag 840

ctggcgttga aagaagagaa tgtcgcggtc gcgagctcag agagtgaagt gaaggtagaa 900

acgagcagcg aagcatggtc aatttaa 927

<210>32

<211>984

<212>DNA

<213>授粉熊蜂(Bombus terrestris)

<400>32

atgaagattc cagcactgct cgtaacgtgc ctctaccttt ggggcttcgc gtccgccggc 60

cagagctcac ctctgctcga gatcgtgcag ggtagcgcgt cggccaccgc atccaccgct 120

gtgaccgcta gatccggact tcgtgccggt caggtagccg tggcctcgca gaaggatgcc 180

acacttcagg cagatgcctc agcggccgcc gcggccgctg cacgcgcttc cgccgaccag 240

tcggccagtc tagcccaaca gtcggcgtct ttgcagtcca aagctgccgc cagagcaaaa 300

tcagccgagg agtcagcggc agctacggcc aaagccgagt tgcaggcaga atccattgct 360

gcatctgcca gttccaatgc cagagaggct gcagcgtccg caaaagcctc cgcatccgcg 420

atgtcatcgg ctgccgtgca ggcgaaactc gctgaaaaga cggccaagaa tcaagctctg 480

gcttccgaag aagccaaact caaggctgcc gccgctgcca gcgcagcagc agcagccagc 540

gccgccgccg aggcagccct gaaagctgag agaatagcgg aagaagccat cgccaaggcg 600

gccgctgcca aagcagccgc cagagccgct gcagccgcgt taaactccgc gaaggaagcc 660

gccacgagca gcgcaaggag cgccgccgaa gccgaagcta agagcgaagt cgctatactg 720

atcagcgaac tcgacaagaa gagcagggaa gtcgccgctt ccgcgtccgc caaggcacgc 780

gctgctgctg cggctagctc cagaaacgca gaaacggctg ttatcggagc taacatcaat 840

gtggccaaag aggtcttggc gattcccatc gagccaaaga aacttccgga gccagagctg 900

gcgttgaaag aagagaatgt cgcggtcgcg agctcagaga gtgaagtgaa ggtagaaacg 960

agcagcgaag catggtcaat ttaa 984

<210>33

<211>882

<212>DNA

<213>授粉熊蜂(Bombus terrestris)

<400>33

cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 60

gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 120

aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 180

aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 240

atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 300

gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 360

gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 420

gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 480

gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 540

aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 600

gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 660

accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 720

gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 780

gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 840

tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 882

<210>34

<211>942

<212>DNA

<213>授粉熊蜂(Bombus terrestris)

<400>34

atgaagattc cagcaatact ggttacgtct ctgctggtct ggggtggtct ggccgagggc 60

cacgtggtga agcgcgacaa ggagctcaag gccccggctt taccggaact actcggtgat 120

gggtctgaca cgctcggtgc ctcgatggag aacgggatca aagtcgccag agcatcgcag 180

aatgtgggtc tgagaacaga gttgaatgca gccgcgcggg ctgcagccgc tgctgcgacc 240

aagcaggcca aagacacaga ggccgcggaa gctggagcgg ccgctgcgat tgccatcgct 300

atcgccaagc gtgaagaagc tatcaaagca agcgaattag ccagcaagtt gttgacagcc 360

gcggctgggt ccagcgaagc tgccgtgtca gcgacggtga gggcggcgca attgacggcc 420

gcagctagcg cagctgccaa agcttctgca tccgcctctg aggcttctgc cgaagcccag 480

gtgagggcca acgccgaagc aaacatcgcc aagaaagctt cggcagctga agcaaaagcc 540

gcagccgaag cccaggttaa ggcggaactc gccaagaaag cggccgccgg tttcttagct 600

aaggctagac tagcggccag cgccgaatcc gaggccacta aactcgcagc cgaagctgaa 660

gtagcactgg ctaaggccag agtcgccgtc gaccagtcgc agagcgcaca ggcaaccgct 720

accgctcaag ctgccacagc cgttcagctg cagtctcaag cagctaacgc ggaagcctcc 780

gctgtagcac aggctgaaac tctgctggtc acggcggaag ccgtctctgc cgcggaagcc 840

gaagccgcga ccaaagctac cagttggggc gaagaatgtc atcaacgaga aaaagttacg 900

tttagcgaag atcgattaaa cgagagacaa gacaattggt ag 942

<210>35

<211>942

<212>DNA

<213>授粉熊蜂(Bombus terrestris)

<400>35

ggtagcgtgg aactcggtgc ccccaagcag gagtctgtcc tcgtggagca gctcctattg 60

aagaacgtgg agactagtgc gaagcgaaag gagaacggcg caccgaaact cggcgagagc 120

acagctgcgg ctctggctag taccaaggca actgcagccg cagaggctaa ggcatccgcc 180

aaagtgaaag cttctgcctt ggccctcgct gaggctttct tgcgtgcgtc ggcagcgttt 240

gctgctgctt cagccaaagc tgctgccgct gtaaaggaag caacgcaggc acagttgctg 300

gcacaggaga aggctttgat agcgttgaaa actcaatctg agcaacaagc tgcctctgct 360

cgcgcggacg ccgcggctgc cgcagccgta tccgcgctag aacgcgccca ggcctcctcc 420

agagcagcca cgaccgccca agacatctcc agcgatctgg agaaacgtgt cgccacctca 480

gccgctgctg aagcaggtgc caccctcaga gcggaacaat ccgccgcgca atcgaaatgg 540

tccgccgcac tggccgccca aaccgccgct gctgcagccg ctatagaagc aaaggccacc 600

gcttcctcag aaagcaccgc tgccgctact agtaaggccg ccgtgttgac cgctgacact 660

agcagcgcag aagctgccgc tgcagcggag gcacaatccg cttcgcggat cgcaggtaca 720

gcagccaccg agggatccgc caactgggct agcgagaact cgcgtaccgc acaactggaa 780

gcttccgcct cagcgaaggc caccgcagcc gcagctgtcg gagatggagc tattatagga 840

cttgcacggg acgctagtgc cgcagctcag gcagccgcag aagttaaagc cttagctgaa 900

gctagtgcca gcttaggtgc ttcagaaaag gacaagaaat ga 942

<210>36

<211>999

<212>DNA

<213>授粉熊蜂(Bombus terrestris)

<400>36

atgcagatcc cagcgatttt cgtcacgtgc ctgctcacat ggggcctggt gcacgcaggt 60

agcgtggaac tcggtgcccc caagcaggag tctgtcctcg tggagcagct cctattgaag 120

aacgtggaga ctagtgcgaa gcgaaaggag aacggcgcac cgaaactcgg cgagagcaca 180

gctgcggctc tggctagtac caaggcaact gcagccgcag aggctaaggc atccgccaaa 240

gtgaaagctt ctgccttggc cctcgctgag gctttcttgc gtgcgtcggc agcgtttgct 300

gctgcttcag ccaaagctgc tgccgctgta aaggaagcaa cgcaggcaca gttgctggca 360

caggagaagg ctttgatagc gttgaaaact caatctgagc aacaagctgc ctctgctcgc 420

gcggacgccg cggctgccgc agccgtatcc gcgctagaac gcgcccaggc ctcctccaga 480

gcagccacga ccgcccaaga catctccagc gatctggaga aacgtgtcgc cacctcagcc 540

gctgctgaag caggtgccac cctcagagcg gaacaatccg ccgcgcaatc gaaatggtcc 600

gccgcactgg ccgcccaaac cgccgctgct gcagccgcta tagaagcaaa ggccaccgct 660

tcctcagaaa gcaccgctgc cgctactagt aaggccgccg tgttgaccgc tgacactagc 720

agcgcagaag ctgccgctgc agcggaggca caatccgctt cgcggatcgc aggtacagca 780

gccaccgagg gatccgccaa ctgggctagc gagaactcgc gtaccgcaca actggaagct 840

tccgcctcag cgaaggccac cgcagccgca gctgtcggag atggagctat tataggactt 900

gcacgggacg ctagtgccgc agctcaggca gccgcagaag ttaaagcctt agctgaagct 960

agtgccagct taggtgcttc agaaaaggac aagaaatga 999

<210>37

<211>1017

<212>DNA

<213>授粉熊蜂(Bombus terrestris)

<400>37

ggcaaaccac tcattgccaa tgcgcaaata gggaaggtca agaccgaaac gtcatcgtct 60

tcagagattg agacgttggt atcaggaagc cagacattgg tggcaggaag tgagacattg 120

gcttcagaaa gcgaggcatt ggcgtcaaaa agcgaggcat tgacgtcaga agccgagata 180

gcgagcgtga caacgaagga cgagctcata ctaaagggcg aagctatcac tggaaagaaa 240

ctaggaaccg gggcgtcgga agtagcggcg gcctctgggg aggctatcgc aactaccctt 300

ggcgcgggac aagctgcagc agaggcacaa gcagccgccg ccgcgcaagc aaaatcagca 360

gcggcagctg ccgcgaatgc aggtgaatcc agcaacagtg ctgctgcgtt ggttgctgct 420

gcagctgcag cacaaggaaa agcggctgcc gccgcagcag ccgcgacgaa ggctagctta 480

gaggccgcag acgctgctga ggaagctgag tcggccgtgg ccttggctag ggctgcctcc 540

gcaaaggcgg aagcgctcgc atcgaccgcc gctgctgcga atacccgtgc tgctctccaa 600

gcggaaaaat cgaacgagct ggcgcaagct gaggctgcag ccgccgccga agcccaggct 660

aaagccgccg ctgctgccaa ggcaacacaa ctcgccctta aagttgccga aactgcggtg 720

aaaacggaag cagatgcagc agctgccgcc gttgcggccg caaaagccag agcagtcgca 780

gacgcagccg cgtctcgtgc gaccgcagtg aacgccattg ctgaagcgga agaaagagac 840

tctgcacagg cggagaacac cgctggtgta gcacaagcag cgctcgctgc tgcggaagca 900

caagactcct gcatcggcgc tgccgcgact cctaggcatt cgtcgagcta tgcatggtgg 960

aagcttagga taacatcctt gatcgtcatt ctatcgccac gcaatcgacg tacttaa 1017

<210>38

<211>1074

<212>DNA

<213>授粉熊蜂(Bombus terrestris)

<400>38

atgaagattc catcgatact cgcggtgtcc ctgctggttt ggggtctggc cagcgcaggc 60

aaaccactca ttgccaatgc gcaaataggg aaggtcaaga ccgaaacgtc atcgtcttca 120

gagattgaga cgttggtatc aggaagccag acattggtgg caggaagtga gacattggct 180

tcagaaagcg aggcattggc gtcaaaaagc gaggcattga cgtcagaagc cgagatagcg 240

agcgtgacaa cgaaggacga gctcatacta aagggcgaag ctatcactgg aaagaaacta 300

ggaaccgggg cgtcggaagt agcggcggcc tctggggagg ctatcgcaac tacccttggc 360

gcgggacaag ctgcagcaga ggcacaagca gccgccgccg cgcaagcaaa atcagcagcg 420

gcagctgccg cgaatgcagg tgaatccagc aacagtgctg ctgcgttggt tgctgctgca 480

gctgcagcac aaggaaaagc ggctgccgcc gcagcagccg cgacgaaggc tagcttagag 540

gccgcagacg ctgctgagga agctgagtcg gccgtggcct tggctagggc tgcctccgca 600

aaggcggaag cgctcgcatc gaccgccgct gctgcgaata cccgtgctgc tctccaagcg 660

gaaaaatcga acgagctggc gcaagctgag gctgcagccg ccgccgaagc ccaggctaaa 720

gccgccgctg ctgccaaggc aacacaactc gcccttaaag ttgccgaaac tgcggtgaaa 780

acggaagcag atgcagcagc tgccgccgtt gcggccgcaa aagccagagc agtcgcagac 840

gcagccgcgt ctcgtgcgac cgcagtgaac gccattgctg aagcggaaga aagagactct 900

gcacaggcgg agaacaccgc tggtgtagca caagcagcgc tcgctgctgc ggaagcacaa 960

gactcctgca tcggcgctgc cgcgactcct aggcattcgt cgagctatgc atggtggaag 1020

cttaggataa catccttgat cgtcattcta tcgccacgca atcgacgtac ttaa 1074

<210>39

<211>1411

<212>DNA

<213>授粉熊蜂(Bombus terrestris)

<400>39

ggaaattcgg aaagcggcga aaattggaag aacggtgaaa gctccgaaag cggcaaaaat 60

tggaggaaca gcggaagctc cgaaagcggc aaaaattgga agaatggcgg aagctcagaa 120

agcaacaaac attggaagaa cggtggaagc tcggaaagcg gcgagaaatg gaaaaacagt 180

gaaagctccg aaagcggcaa aaattggaag aacagcggaa gctccgaaag cggcaaaaat 240

tggaaaaacg gcggaagctc ggaaagcaac aaacattgga agagcggtgg aagctcggaa 300

agtggcgaga aatggaaaaa cagtgaaagc ggaaataaag gcaaaagctc aaaaagcagc 360

gaaagttgga agagcaacga aaactcgaag aacgacggca gctggaagag cagtgaagaa 420

tcagaaaagt ggaaagatgg taaagcagtg gcggaagaca gcgttagtat aaactgggca 480

gatgtcaaag agcagattag caacattgct acatccttag aaaagggtgg taacctcgag 540

gctgtattga aaataaagaa aggagaaaag aaaatttcaa gtttggagga aatcaaggag 600

aaaatctctg tcctactgaa atggattcaa gaaggcaaag atactagcag cctattagat 660

ttgaaagagg gtagcaagga tattgcgtcg ttgaaagaaa tcaaaggaaa gatccttttg 720

attgttaaat tagtgaacga agggaaagac actagtggtc ttttagattt agaagcgagt 780

ggcaaagtaa ttttagaatt gcaaagcgcc atagaaaagg ttctcgtaaa gtcagaaaag 840

gtaaccaaag tatctgaagt ttccggttta gtaaaaagca aaactgtctc ggacataaaa 900

ccgcttcaag cagtaattcc tttaatcctt gaattgcaaa aaacagacat taaccttagt 960

accttaaaca agtggtccac tgttaacgta aattctatag ataaagaacg cgtcacgaaa 1020

acggttccag tgctccttca atccatgaaa ggaggcgaag atattcagaa ccttttgagt 1080

gcgaaaggtg caaagaaact tggcattagt gctttggact tacaggcagt tcaaggagct 1140

cttggcgtgg ttggaaagct aagttcaggt ggtgcgttga actcaaaagg cttgttgaac 1200

ttgaaagacg gcgctagtgt gttaggtgca ggaaaaatcg gaggattaat tcctttaccg 1260

aaactttaag agatagaccg ataaaggcag atatactctc ggaagatttt tttggaagtt 1320

gaatagtccg caaaaaaatt atctctgatt attataattt agcctaaaat attaaataaa 1380

atggagaaat aacgttgaaa tatataaata a 1411

<210>40

<211>403

<212>PRT

<213>牛头犬蚁(Myrmecia forficata)

<400>40

Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser Ala Ser Ala

1 5 10 15

Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys Ser Gly Ala

20 25 30

Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile Leu Ser Arg

35 40 45

Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser Ala Ala Val

50 55 60

Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala Glu Glu Gln

65 70 75 80

Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys Asn Ala Glu

85 90 95

Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln Gly Ser Ala

100 105 110

Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val Glu Glu Glu

115 120 125

Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val Ala Ala Ala

130 135 140

Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala Gln Thr Ala

145 150 155 160

Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr Ala Leu Lys

165 170 175

Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala Arg Met Met

180 185 190

Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala Ala Gln Gln

195 200 205

Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala Ile Ala Ala

210 215 220

Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala Lys Ala Ala

225 230 235 240

Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln Ala Asn Ala

245 250 255

Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser Lys Ser Arg

260 265 270

Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala Ser Lys Ser

275 280 285

Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu Phe Gly Lys

290 295 300

Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn Gly Gly Gln

305 310 315 320

Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser Ala Val Gly

325 330 335

Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp Ser Arg Val

340 345 350

Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala Asp Ala Ser

355 360 365

Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly Leu Gly Ser

370 375 380

Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser Ala Gly Thr

385 390 395 400

Leu Leu Leu

<210>41

<211>422

<212>PRT

<213>牛头犬蚁(Myrmecia forficata)

<400>41

Met Lys Ile Pro Ala Ile Ile Ala Thr Ser Leu Leu Leu Trp Gly Phe

1 5 10 15

Ala Ser Ala Ser Gly Pro Arg Leu Leu Gly Gly Arg Ser Ala Ala Ser

20 25 30

Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser Ala Gly Gly Trp Arg Lys

35 40 45

Ser Gly Ala Ser Ala Ser Ala Ser Ala Lys Ala Gly Ser Ser Asn Ile

50 55 60

Leu Ser Arg Val Gly Ala Ser Arg Ala Ala Ala Thr Leu Val Ala Ser

65 70 75 80

Ala Ala Val Glu Ala Lys Ala Gly Leu Arg Ala Gly Lys Ala Thr Ala

85 90 95

Glu Glu Gln Arg Glu Ala Leu Glu Met Leu Thr Leu Ser Ala Asp Lys

100 105 110

Asn Ala Glu Ala Arg Ile Leu Ala Asp Asp Thr Ala Val Leu Val Gln

115 120 125

Gly Ser Ala Glu Ala Gln Ser Val Ala Ala Ala Lys Thr Val Ala Val

130 135 140

Glu Glu Glu Ser Ala Ser Leu Asp Ala Ala Ala Val Glu Ala Glu Val

145 150 155 160

Ala Ala Ala Thr Ser Lys Ser Ser Ala Gly Gln Ala Leu Gln Ser Ala

165 170 175

Gln Thr Ala Ala Ser Ala Leu Arg Thr Ser Ala Arg Ser Ala Leu Thr

180 185 190

Ala Leu Lys Leu Ala Arg Leu Gln Gly Ala Ala Ser Ser Asn Ala Ala

195 200 205

Arg Met Met Glu Lys Ala Leu Ala Ala Thr Gln Asp Ala Asn Ala Ala

210 215 220

Ala Gln Gln Ala Met Ala Ala Glu Ser Ala Ala Ala Glu Ala Ala Ala

225 230 235 240

Ile Ala Ala Ala Lys Gln Ser Glu Ala Arg Asp Ala Gly Ala Glu Ala

245 250 255

Lys Ala Ala Met Ala Ala Leu Ile Thr Ala Gln Arg Asn Leu Val Gln

260 265 270

Ala Asn Ala Arg Ala Glu Met Ala Ser Glu Glu Ala Glu Leu Asp Ser

275 280 285

Lys Ser Arg Ala Ser Asp Ala Lys Val Asn Ala Val Ala Arg Ala Ala

290 295 300

Ser Lys Ser Ser Ile Arg Arg Asp Glu Leu Ile Glu Ile Gly Ala Glu

305 310 315 320

Phe Gly Lys Ala Ser Gly Glu Val Ile Ser Thr Gly Thr Arg Ser Asn

325 330 335

Gly Gly Gln Asp Ala Ile Ala Thr Ala Glu Ala Ser Ser Ser Ala Ser

340 345 350

Ala Val Gly Ile Lys Lys Thr Ser Gly His Trp Gly Ser Gly Lys Trp

355 360 365

Ser Arg Val Ser Lys Gly Lys Gly Trp Ala Ser Ser Asn Ala Asp Ala

370 375 380

Asp Ala Ser Ser Ser Ser Ile Ile Ile Gly Gly Leu Lys Arg Gly Gly

385 390 395 400

Leu Gly Ser Glu Ala Ser Ala Ala Ala Ser Ala Glu Ala Glu Ala Ser

405 410 415

Ala Gly Thr Leu Leu Leu

420

<210>42

<211>392

<212>PRT

<213>牛头犬蚁(Myrmecia forficata)

<400>42

Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala Ser Ala Ser

1 5 10 15

Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly Lys Leu Glu

20 25 30

Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu Glu Ser Leu

35 40 45

Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly Leu Asp Val

50 55 60

Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp Val Ala Thr

65 70 75 80

Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly Pro Val Ala

85 90 95

Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr Ser Ala Gln

100 105 110

Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile Ala Ala Met

115 120 125

Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val Thr Thr Lys

130 135 140

Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala Arg Ala Thr

145 150 155 160

Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser Ala Ala Ser

165 170 175

Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala Ala Ser Ile

180 185 190

Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala Ala Val Leu

195 200 205

Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys Ser Leu Ser

210 215 220

Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala Glu Ala Ser

225 230 235 240

Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala Val Ala Arg

245 250 255

Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln Ala Ala Ser

260 265 270

Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala Ser Ala Gln

275 280 285

Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr Ala Asp Ala

290 295 300

Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu Lys Asn Asp

305 310 315 320

Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala Glu Gly Glu

325 330 335

Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg Ser Gly Ser

340 345 350

Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser Met Gly Gly

355 360 365

Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala Gly Ala Ser

370 375 380

Ala Gly Ser Ser Ala Asp Ser Leu

385 309

<210>43

<211>411

<212>PRT

<213>牛头犬蚁(Myrmecia forficata)

<400>43

Met Lys Ile Pro Ala Ile Leu Val Thr Ser Leu Leu Ala Trp Gly Leu

1 5 10 15

Ala Ser Gly Arg Val Ile Glu Ser Ser Ser Ser Ala Ser Ala Gln Ala

20 25 30

Ser Ala Ser Ala Gly Ser Arg Gly Leu Leu Gly Lys Arg Pro Ile Gly

35 40 45

Lys Leu Glu Trp Gly Lys Glu Glu Lys Lys Leu Glu Glu Leu Asp Glu

50 55 60

Glu Ser Leu Asn Glu Ala Ala Leu Lys Val Gly Ile Lys Asn Gly Gly

65 70 75 80

Leu Asp Val Ala Lys Gly Ala Ala Val Leu Glu Ala Ala Met Ser Asp

85 90 95

Val Ala Thr Leu Thr Asp Gln Arg Ser Leu Val Asp Leu Gly Leu Gly

100 105 110

Pro Val Ala Asn Glu Ala Glu Ile Leu Ala Glu Ala Gln Ala Ala Thr

115 120 125

Ser Ala Gln Ala Gly Ala Val Ala Asn Ser Ala Ala Glu Arg Ala Ile

130 135 140

Ala Ala Met Glu Met Ala Asp Arg Thr Glu Tyr Ile Ala Ala Leu Val

145 150 155 160

Thr Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Met Ala Ala Thr Ala

165 170 175

Arg Ala Thr Ala Ala Ala Ser Ala Ser Lys Ile Ser Ser Gln Glu Ser

180 185 190

Ala Ala Ser Ala Ala Asn Ala Ala Asn Ala Glu Ala Lys Ala Asn Ala

195 200 205

Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala Glu Ala Ala

210 215 220

Ala Val Leu Ala Ala Thr Ala Ala Lys Ala Lys Glu Ser Ala Met Lys

225 230 235 240

Ser Leu Ser Ala Ala Gln Ala Ala Ala Lys Ala Gln Ala Arg Asn Ala

245 250 255

Glu Ala Ser Ala Glu Ala Gln Ile Lys Leu Ser Gln Ala Arg Ala Ala

260 265 270

Val Ala Arg Ala Ala Ala Asp Gln Ala Val Cys Ser Ser Gln Ala Gln

275 280 285

Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ser Glu Ser Ala Ala

290 295 300

Ser Ala Gln Ser Glu Thr Asn Thr Ala Ala Ala Glu Ala Val Ala Thr

305 310 315 320

Ala Asp Ala Glu Ala Ala Ala Gln Ala Glu Ala Trp Val Met Ser Leu

325 330 335

Lys Asn Asp Leu Trp Leu His Leu Asn Met Lys Gly Glu Ala Lys Ala

340 345 350

Glu Gly Glu Ala Val Ser Ile Ser Lys Gly His Arg Gly Gly Ile Arg

355 360 365

Ser Gly Ser Ile Ser Glu Ala Ser Ala Glu Ala Ser Ser Asn Val Ser

370 375 380

Met Gly Gly Arg His Gly Arg Lys Asp Leu Val Ser Glu Ala Leu Ala

385 390 395 400

Gly Ala Ser Ala Gly Ser Ser Ala Asp Ser Leu

405 410

<210>44

<211>375

<212>PRT

<213>牛头犬蚁(Myrmecia forficata)

<400>44

Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser Ala Ser Ala

1 5 10 15

Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu Pro Leu Pro

20 25 30

Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val Phe Asp Ile

35 40 45

Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly Ala Pro Lys

50 55 60

Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu Arg Ala Glu

65 70 75 80

Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile Lys Lys Ile

85 90 95

Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp Ala Ser Ala

100 105 125

Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala Gln Ala Ser

115 120 125

Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu Ala Leu Ser

130 135 140

Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala Ala Ala Thr

145 150 155 160

Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala Ala Asn Ala

165 170 175

Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn Arg Ser Ala

180 185 190

Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala Ser Ala Leu

195 200 205

Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala Ala Ala Ser

210 215 220

Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr Ala Arg Ala

225 230 235 240

Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser Ala Gln Glu

245 250 255

Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu Glu Lys Ala

260 265 270

Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr Tyr Thr Ala

275 280 285

Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile Asn Ala Leu

290 295 300

Arg Asp Gly Ile Val Val Gly Mer Gly Asn Asp Ala Gly Ala Ser Ala

305 310 315 320

Gln Ala Met Ala Gln Val Glu Ala Leu Ala Arg Ala Ser Glu His Lys

325 330 335

Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr Gly Ser Lys

340 345 350

Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala Ser

355 360 365

Ser Arg Leu Gly Lys Asp Trp

370 375

<210>45

<211>394

<212>PRT

<213>牛头犬蚁(Myrmecia forficata)

<400>45

Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu

1 5 10 15

Ala Ser Gly Asn Leu Leu Lys Glu Ser Lys Ala Ser Ala Ser Ala Ser

20 25 30

Ala Ser Ala Ser Ala Arg Ala Ser Gly Lys Lys Asn Leu His Val Leu

35 40 45

Pro Leu Pro Lys Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser Val

50 55 60

Phe Asp Ile Lys Asp Val Val Leu Ser Ala Val Asp Glu Ile Asn Gly

65 70 75 80

Ala Pro Lys Leu Gly Leu Gly Trp Lys Lys Val Ser Met Gly Val Glu

85 90 95

Arg Ala Glu Ala Asn Ala Ala Ala Ala Ala Glu Ala Leu Ala Met Ile

100 105 110

Lys Lys Ile Ala Met Ala Arg Ser Ser Ala Tyr Val Gln Ala Ala Trp

115 120 125

Ala Ser Ala Gln Ala Ser Ala Asp Ala Leu Ala Ser Ala Arg Val Ala

130 135 140

Gln Ala Ser Gln Glu Ala Ala Glu Ala Lys Gly Arg Ala Ala Ser Glu

145 150 155 160

Ala Leu Ser Arg Ala Ile Glu Ala Ser Ser Arg Ala Asp Ala Ala Ala

165 170 175

Ala Ala Thr Leu Asp Ala Met Asp Arg Thr Met Glu Asn Ala Arg Ala

180 185 190

Ala Asn Ala Ala Gln Thr Gln Ala Ser Gly Gln Ala Glu Asn Ala Asn

195 200 205

Arg Ser Ala Ala Ala Ile Leu Ala Ala Leu Leu Arg Ile Ala Glu Ala

210 215 220

Ser Ala Leu Asn Asn Glu Ala Ala Val Asn Ala Ala Ala Ala Ala Ala

225 230 235 240

Ala Ala Ser Ala Leu Gln Ala Lys Ala Asn Ala Ala Ser Gln Ala Thr

245 250 255

Ala Arg Ala Ala Gly Gln Ala Ser Thr Ala Ala Glu Glu Ala Gln Ser

260 265 270

Ala Gln Glu Ala Ala Asp Lys Asn Ala Glu Leu Thr Thr Val Met Leu

275 280 285

Glu Lys Ala Ser Ala Asp Gln Gln Ala Ala Ser Ala Arg Ala Asp Tyr

290 295 300

Tyr Thr Ala Ser Thr Glu Ala Glu Ala Ala Ala Gln Ala Ser Ala Ile

305 310 315 320

Asn Ala Leu Arg Asp Gly Ile Val Val Gly Met Gly Asn Asp Ala Gly

325 330 335

Ala Ser Ala Gln Ala Met Ala Gln Val Glu Ala Leu Ala Ar Ala Ser

340 345 350

Glu His Lys Ala Leu Gly Glu Lys Lys Lys Gly Leu Val Trp Gly Tyr

355 360 365

Gly Ser Lys Gly Ser Ser Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala

370 375 380

Glu Ala Ser Ser Arg Leu Gly Lys Asp Trp

385 390

<210>46

<211>422

<212>PRT

<213>牛头犬蚁(Myrmecia forficata)

<400>46

Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala Gln Ala Glu

1 5 10 15

Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser Gln Ala Ser

20 25 30

Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly Gly Ser Lys

35 40 45

Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser Glu Ala Lys

50 55 60

Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly Thr Gly Ile

65 70 75 80

Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly Leu Gly

85 90 95

Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly Gln Ala

100 105 110

Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr Thr Ala Lys

115 120 125

Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile Glu Val Ala

130 135 140

Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala Ala Lys Ala

145 150 155 160

Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala Ala Ala Gly

165 170 175

Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu Arg Arg Ala

180 185 190

Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala Ser Ser Ala

195 200 205

Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg Glu Ala Ala

210 215 220

Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile Glu Gln Glu

225 230 235 240

Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu Asn Ala Glu

245 250 255

Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala Ser Ala Glu

260 265 270

Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val Ala Arg Ala

275 280 285

Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr Asp Ala Gly

290 295 300

Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys Gly Glu Leu

305 310 315 320

Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn Ala Asp Leu

325 330 335

Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly Gln Val Gln

340 345 350

Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly Trp Gly Lys

355 360 365

Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg Ala Ser Ala

370 375 380

Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp Gly Arg Gln

385 390 395 400

Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu Ala Asp Ser

405 410 415

Gln Leu Leu Lys Val Trp

420

<210>47

<211>441

<212>PRT

<213>牛头犬蚁(Myrmecia forficata)

<400>47

Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Leu Ile Trp Gly Leu

1 5 10 15

Val Gly Ala Ser Glu Leu Glu Ser Glu Ala Ser Ala Ala Ala Ser Ala

20 25 30

Gln Ala Glu Ala Ser Ser Ser Gly Arg Ser Gly Lys Leu Ser Ala Ser

35 40 45

Gln Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Ser Arg Gly

50 55 60

Gly Ser Lys Gly Gly Trp Gly Gln Leu Arg Arg Gly Asp Val Lys Ser

65 70 75 80

Glu Ala Lys Ser Ala Ala Ala Ile Ala Val Glu Gly Ala Lys Ile Gly

85 90 95

Thr Gly Ile Gly Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg

100 105 110

Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala

115 120 125

Gly Gln Ala Glu Val Ala Ala Lys Ser Cys Glu Leu Ala Asp Lys Thr

130 135 140

Thr Ala Lys Ala Val Ala Met Val Glu Ala Ala Ala Glu Ala Glu Ile

145 150 155 160

Glu Val Ala Asn Gln Glu Val Ala Ala Val Lys Leu Ser Thr Trp Ala

165 170 175

Ala Lys Ala Ala Arg Ile Val Glu Glu Asp Ser Ala Ala Val Arg Ala

180 185 190

Ala Ala Gly Lys Leu Leu Leu Ala Ala Arg Ala Ala Ala Ala Ala Glu

195 200 205

Arg Arg Ala Asn Glu Glu Ser Glu Ala Ala Asn Glu Leu Ala Gln Ala

210 215 220

Ser Ser Ala Ala Ala Ala Glu Ala Glu Ala Lys Ala Asn Ala Gly Arg

225 230 235 240

Glu Ala Ala Ala Ala Ala Leu Ala Ile Ala Glu Ala Ala Val Ala Ile

245 250 255

Glu Gln Glu Ala Val Ile Leu Ala Arg Lys Ala Gln Asp Ala Arg Leu

260 265 270

Asn Ala Glu Ala Ala Ala Ala Ala Ala Met Asn Ala Arg Val Ile Ala

275 280 285

Ser Ala Glu Ser Glu Ala Ser Glu Asp Leu Glu Asn Arg Ala Ser Val

290 295 300

Ala Arg Ala Ser Ala Ala Gly Ala Ala Glu Ala Lys Ala Ile Ala Thr

305 310 315 320

Asp Ala Gly Ala Thr Ala Glu Ile Ala Ala Tyr Ser Trp Ala Lys Lys

325 330 335

Gly Glu Leu Ile Asn Pro Gly Pro Leu Pro Lys Ile Ile Ser Val Asn

340 345 350

Ala Asp Leu Ser Lys Ser Glu Val Glu Ala Met Lys Ile Thr Arg Gly

355 360 365

Gln Val Gln Glu Val Lys Lys Ile Ser Thr His Lys Gly Gly Trp Gly

370 375 380

Trp Gly Lys Glu Gly Arg Ser Lys Val Ser Ser Asn Ala Ser Ala Arg

385 390 395 400

Ala Ser Ala Ser Ala Asn Ala Ala Ala Gly Ser Leu Gly Ser Lys Trp

405 410 415

Gly Arg Gln Leu Ser Ala Ser Ser Ala Ser Ala Asp Ala Asn Ala Glu

420 425 430

Ala Asp Ser Gln Leu Leu Lys Val Trp

435 440

<210>48

<211>1212

<212>DNA

<213>牛头犬蚁(Myrmecia forficata)

<400>48

agcgggccgc gcttactcgg cggcagatcg gccgcgtccg cgtcggcttc cgcttcggct 60

gaggcgtcgg cgggcggttg gaggaaaagc ggcgcatccg cttccgcttc cgctaaggct 120

ggtagcagca acatcctcag ccgcgtggga gcttcgaggg cggccgcgac gttggtcgct 180

tccgccgcgg tggaggccaa ggcgggtctc cgtgccggca aggcaaccgc cgaggagcag 240

agggaggctt tggaaatgct caccttgtcc gccgacaaga atgccgaggc gcgtatcctg 300

gccgacgaca cggccgttct ggttcaaggc agcgccgagg cacagtcggt cgccgccgcg 360

aagaccgtcg cggtcgagga agagtccgct tccttggatg cggccgcagt tgaagcggag 420

gtcgcagccg ccacgtcgaa atcgtcggct ggccaagcac tccagtccgc acagaccgcc 480

gcatctgctc tcagaacttc cgccaggagc gccttgacgg ccctcaagct ggcacgcctc 540

caaggcgcgg cttctagcaa cgctgccagg atgatggaaa aggcgctggc cgccacccag 600

gacgcaaatg ccgccgccca gcaagctatg gcggccgaga gtgcagccgc agaagcagcg 660

gctatcgcgg cagcgaaaca atcggaggcg agagacgccg gcgccgaggc caaggccgcc 720

atggcagcac tcatcaccgc ccagaggaat ctcgtgcagg ccaatgccag ggcggaaatg 780

gcaagcgagg aagccgaatt ggattcgaag tctagagcgt ccgacgccaa ggtgaacgcc 840

gttgctcgtg cggcctccaa gtccagcata cgcagagatg aacttatcga gatcggcgct 900

gagttcggca aggccagcgg cgaggtgatt tccaccggca cgcgttccaa cggcggtcaa 960

gacgccatcg ccaccgccga ggcatcgagt agcgcgtccg ccgtcggcat caagaaaaca 1020

agcggacact gggggagcgg aaaatggagt cgtgtctcca agggtaaagg atgggcttcc 1080

tcgaatgcgg acgctgacgc cagcagcagc agcatcatca tcggcggtct caaacgcggc 1140

ggcctcggtt cggaagcctc tgcggcagct tccgcagaag cggaagcttc cgccggcaca 1200

ctcctgctgt aa 1212

<210>49

<211>1269

<212>DNA

<213>牛头犬蚁(Myrmecia forficata)

<400>49

atgaagatcc cagcgataat cgcaacgtcc cttctcctct ggggtttcgc cagcgccagc 60

gggccgcgct tactcggcgg cagatcggcc gcgtccgcgt cggcttccgc ttcggctgag 120

gcgtcggcgg gcggttggag gaaaagcggc gcatccgctt ccgcttccgc taaggctggt 180

agcagcaaca tcctcagccg cgtgggagct tcgagggcgg ccgcgacgtt ggtcgcttcc 240

gccgcggtgg aggccaaggc gggtctccgt gccggcaagg caaccgccga ggagcagagg 300

gaggctttgg aaatgctcac cttgtccgcc gacaagaatg ccgaggcgcg tatcctggcc 360

gacgacacgg ccgttctggt tcaaggcagc gccgaggcac agtcggtcgc cgccgcgaag 420

accgtcgcgg tcgaggaaga gtccgcttcc ttggatgcgg ccgcagttga agcggaggtc 480

gcagccgcca cgtcgaaatc gtcggctggc caagcactcc agtccgcaca gaccgccgca 540

tctgctctca gaacttccgc caggagcgcc ttgacggccc tcaagctggc acgcctccaa 600

ggcgcggctt ctagcaacgc tgccaggatg atggaaaagg cgctggccgc cacccaggac 660

gcaaatgccg ccgcccagca agctatggcg gccgagagtg cagccgcaga agcagcggct 720

atcgcggcag cgaaacaatc ggaggcgaga gacgccggcg ccgaggccaa ggccgccatg 780

gcagcactca tcaccgccca gaggaatctc gtgcaggcca atgccagggc ggaaatggca 840

agcgaggaag ccgaattgga ttcgaagtct agagcgtccg acgccaaggt gaacgccgtt 900

gctcgtgcgg cctccaagtc cagcatacgc agagatgaac ttatcgagat cggcgctgag 960

ttcggcaagg ccagcggcga ggtgatttcc accggcacgc gttccaacgg cggtcaagac 1020

gccatcgcca ccgccgaggc atcgagtagc gcgtccgccg tcggcatcaa gaaaacaagc 1080

ggacactggg ggagcggaaa atggagtcgt gtctccaagg gtaaaggatg ggcttcctcg 1140

aatgcggacg ctgacgccag cagcagcagc atcatcatcg gcggtctcaa acgcggcggc 1200

ctcggttcgg aagcctctgc ggcagcttcc gcagaagcgg aagcttccgc cggcacactc 1260

ctgctgtaa 1269

<210>50

<211>1179

<212>DNA

<213>牛头犬蚁(Myrmecia forficata)

<400>50

cgggtcatcg agtccagctc gtcggcttcc gcacaggcgt cggcatcggc cggctcgaga 60

ggcctgctcg gtaaacggcc gattggcaag ctcgagtggg gcaaggagga gaagaaactc 120

gaagaactcg acgaggaatc gctcaatgag gccgctctga aggtcggcat caagaacggc 180

ggattggatg tcgcgaaggg cgcggcagtc ctcgaggcag cgatgagcga cgtcgcgacc 240

cttacggatc agcgttctct tgtggatctc ggtctcggcc cggtcgcgaa cgaggccgag 300

atcctggcgg aggcgcaggc cgccacgagc gcccaagctg gcgctgtcgc taatagcgcc 360

gcggagcgtg cgatcgcggc gatggagatg gccgacagaa ccgaatatat tgcggcactt 420

gtcaccacca aagccgccaa agctgccgag gccactatgg ccgctactgc ccgtgccacc 480

gccgccgcct cagcctccaa gatatccagt caggaatcag ccgcatcggc cgctaacgcc 540

gccaacgccg aagccaaggc caacgccgct tccataatcg ctaacaaggc gaacgccgtc 600

ctggctgagg ccgccgccgt actcgcagcc actgctgcca aggccaagga atcggcgatg 660

aaatcgctta gcgccgctca ggccgccgcc aaggcacaag ccaggaacgc cgaggcctcc 720

gccgaagctc agatcaaact ttcccaggcc agggccgccg tggcacgcgc tgcagccgat 780

caggccgtct gttcctccca ggctcaggcc gcaagtcaga tacaatcgag ggcatccgca 840

tccgaatccg cggcatcggc acaatcagag accaacaccg ccgcggccga agcggtcgcc 900

accgctgacg ccgaagcggc cgcgcaagct gaagcgtggg tcatgtcgct gaagaacgat 960

ctgtggctgc atctcaacat gaagggtgag gccaaggccg aaggcgaggc cgtttcgatc 1020

agcaaaggac atcgcggcgg tatcaggtcg ggcagcatct cggaagccag cgccgaggca 1080

agcagcaacg tttccatggg cggacgtcat ggacggaagg acctcgtctc tgaagcgtta 1140

gcgggagcat cagcgggcag cagtgccgac tccctttga 1179

<210>51

<211>1236

<212>DNA

<213>牛头犬蚁(Myrmecia forficata)

<400>51

atgaagattc cagcgatact cgtgacgtct ctcctcgcct ggggattagc cagcggccgg 60

gtcatcgagt ccagctcgtc ggcttccgca caggcgtcgg catcggccgg ctcgagaggc 120

ctgctcggta aacggccgat tggcaagctc gagtggggca aggaggagaa gaaactcgaa 180

gaactcgacg aggaatcgct caatgaggcc gctctgaagg tcggcatcaa gaacggcgga 240

ttggatgtcg cgaagggcgc ggcagtcctc gaggcagcga tgagcgacgt cgcgaccctt 300

acggatcagc gttctcttgt ggatctcggt ctcggcccgg tcgcgaacga ggccgagatc 360

ctggcggagg cgcaggccgc cacgagcgcc caagctggcg ctgtcgctaa tagcgccgcg 420

gagcgtgcga tcgcggcgat ggagatggcc gacagaaccg aatatattgc ggcacttgtc 480

accaccaaag ccgccaaagc tgccgaggcc actatggccg ctactgcccg tgccaccgcc 540

gccgcctcag cctccaagat atccagtcag gaatcagccg catcggccgc taacgccgcc 600

aacgccgaag ccaaggccaa cgccgcttcc ataatcgcta acaaggcgaa cgccgtcctg 660

gctgaggccg ccgccgtact cgcagccact gctgccaagg ccaaggaatc ggcgatgaaa 720

tcgcttagcg ccgctcaggc cgccgccaag gcacaagcca ggaacgccga ggcctccgcc 780

gaagctcaga tcaaactttc ccaggccagg gccgccgtgg cacgcgctgc agccgatcag 840

gccgtctgtt cctcccaggc tcaggccgca agtcagatac aatcgagggc atccgcatcc 900

gaatccgcgg catcggcaca atcagagacc aacaccgccg cggccgaagc ggtcgccacc 960

gctgacgccg aagcggccgc gcaagctgaa gcgtgggtca tgtcgctgaa gaacgatctg 1020

tggctgcatc tcaacatgaa gggtgaggcc aaggccgaag gcgaggccgt ttcgatcagc 1080

aaaggacatc gcggcggtat caggtcgggc agcatctcgg aagccagcgc cgaggcaagc 1140

agcaacgttt ccatgggcgg acgtcatgga cggaaggacc tcgtctctga agcgttagcg 1200

ggagcatcag cgggcagcag tgccgactcc ctttga 1236

<210>52

<211>1128

<212>DNA

<213>牛头犬蚁(Myrmecia forficata)

<400>52

aatctcctta aggagtcgaa agcttccgcg tccgcgtccg cgtccgcttc cgcgagggcc 60

agcggcaaga agaatcttca cgtgttgcca ttaccgaaga aaagcgagca tggcatcgtg 120

atcgacaagt cggtgttcga catcaaggat gtagtgctga gcgcggtcga cgagatcaac 180

ggcgccccga aactcggcct gggatggaag aaggtcagca tgggggtgga gcgcgccgag 240

gcgaacgcag ccgctgccgc cgaggcattg gcgatgatca agaagattgc catggcccgc 300

agcagtgcat acgtccaggc ggcctgggca tcggcccagg catcagctga cgcattggct 360

agcgccaggg tggcacaggc gtctcaggag gctgcggagg caaagggtag agcggcttcc 420

gaggcgctct ccagagccat cgaagcatcc tcgcgagccg atgcggcagc cgctgcgacg 480

ctggacgcga tggaccgcac catggagaac gcgagggcgg caaatgccgc gcaaacgcag 540

gccagcggcc aagctgagaa cgcaaatcgc agcgctgctg ccatcctcgc agctctgcta 600

cgtatcgcgg aggcatccgc gttgaacaac gaggccgcgg tcaacgcggc cgcggccgca 660

gccgcagcgt ctgcccttca ggccaaggct aacgcggctt ctcaagcaac cgccagagcc 720

gcaggacagg cgtcgacggc cgccgaagag gcgcaatccg cccaagaagc cgccgataag 780

aacgcggagc tgaccacggt catgctcgaa aaggctagtg ctgatcaaca ggcggcatcc 840

gctagggctg actactacac cgcctcaacc gaggccgaag ccgctgcaca ggcgtctgct 900

atcaacgcac tcagggacgg aatagttgtc ggaatgggaa atgacgctgg cgcatcggcc 960

caagcgatgg cacaggtaga agctctcgct cgcgccagcg agcacaaggc gttaggcgag 1020

aagaagaagg gcctggtttg gggctacgga agcaagggca gtagctccgc cagcgcatcc 1080

gccagcgcct ccgccgaagc atcctcgaga ctcggaaagg actggtag 1128

<210>53

<211>1185

<212>DNA

<213>牛头犬蚁(Myrmecia forficata)

<400>53

atgaagatac cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggaat 60

ctccttaagg agtcgaaagc ttccgcgtcc gcgtccgcgt ccgcttccgc gagggccagc 120

ggcaagaaga atcttcacgt gttgccatta ccgaagaaaa gcgagcatgg catcgtgatc 180

gacaagtcgg tgttcgacat caaggatgta gtgctgagcg cggtcgacga gatcaacggc 240

gccccgaaac tcggcctggg atggaagaag gtcagcatgg gggtggagcg cgccgaggcg 300

aacgcagccg ctgccgccga ggcattggcg atgatcaaga agattgccat ggcccgcagc 360

agtgcatacg tccaggcggc ctgggcatcg gcccaggcat cagctgacgc attggctagc 420

gccagggtgg cacaggcgtc tcaggaggct gcggaggcaa agggtagagc ggcttccgag 480

gcgctctcca gagccatcga agcatcctcg cgagccgatg cggcagccgc tgcgacgctg 540

gacgcgatgg accgcaccat ggagaacgcg agggcggcaa atgccgcgca aacgcaggcc 600

agcggccaag ctgagaacgc aaatcgcagc gctgctgcca tcctcgcagc tctgctacgt 660

atcgcggagg catccgcgtt gaacaacgag gccgcggtca acgcggccgc ggccgcagcc 720

gcagcgtctg cccttcaggc caaggctaac gcggcttctc aagcaaccgc cagagccgca 780

ggacaggcgt cgacggccgc cgaagaggcg caatccgccc aagaagccgc cgataagaac 840

gcggagctga ccacggtcat gctcgaaaag gctagtgctg atcaacaggc ggcatccgct 900

agggctgact actacaccgc ctcaaccgag gccgaagccg ctgcacaggc gtctgctatc 960

aacgcactca gggacggaat agttgtcgga atgggaaatg acgctggcgc atcggcccaa 1020

gcgatggcac aggtagaagc tctcgctcgc gccagcgagc acaaggcgtt aggcgagaag 1080

aagaagggcc tggtttgggg ctacggaagc aagggcagta gctccgccag cgcatccgcc 1140

agcgcctccg ccgaagcatc ctcgagactc ggaaaggact ggtag 1185

<210>54

<211>1269

<212>DNA

<213>牛头犬蚁(Myrmecia forficata)

<400>54

agcgagctcg aatcggaagc gagtgcggcg gcgtctgcgc aagcggaagc gtcctcgtct 60

ggtcgctccg gcaaactgtc cgcgtctcag gcttccgcca gcgcgtccgc cagcgcgtca 120

gccggcagca gaggtggcag caaaggtggc tggggccagc tccgccgtgg tgatgttaag 180

agcgaggcga agagcgccgc cgcgatcgcg gtcgaaggag ctaaaatcgg caccggaatc 240

ggaaataccg cgtccgcatc cgcggaggcg ctctcacgag gactcggcat cggacaggcg 300

gccgcggagg cgcaagccgc agccgcaggt caggcagagg tcgccgcgaa atcgtgcgaa 360

cttgccgaca agaccaccgc caaagcggtc gccatggtcg aagcggcagc cgaggccgaa 420

atcgaggtgg ccaatcagga ggtcgcagcc gtcaaattat cgacttgggc cgctaaagca 480

gcaaggatag tcgaggaaga cagcgccgcc gtgagggcgg ctgccggcaa attgcttttg 540

gccgcgagag ctgccgccgc cgccgagaga cgcgccaacg aggaatccga ggcggccaac 600

gaacttgctc aagcgtcatc tgccgctgcc gccgaggccg aagccaaagc gaacgccggc 660

cgtgaggccg ctgccgctgc cttggctatc gccgaggccg ccgtcgccat cgaacaagaa 720

gccgtcattt tggctcgcaa ggcacaagat gcccgtttga atgctgaagc cgcagccgcc 780

gctgcgatga acgcccgtgt catcgcttcc gccgaatccg aggccagtga agatctggag 840

aatcgcgcta gtgtggcgcg tgccagtgcg gccggtgccg ctgaggcaaa ggctatcgcc 900

accgatgccg gcgccactgc cgagatcgcg gcctacagtt gggccaagaa gggcgaactg 960

atcaaccccg gcccgttgcc gaagatcatc agcgtcaacg ccgatctgtc caagagcgag 1020

gtcgaggcca tgaagatcac ccggggtcaa gtacaggaag tcaagaaaat cagcactcac 1080

aaaggtggct ggggatgggg aaaggaagga aggtcgaagg tatcttccaa cgctagtgcc 1140

agagctagtg ccagcgccaa tgcagccgcc ggtagcctcg gcagcaaatg gggaagacaa 1200

ctatccgcat catccgcgtc ggctgacgcc aacgccgaag ccgacagcca gttgctgaaa 1260

gtgtggtga 1269

<210>55

<211>1326

<212>DNA

<213>牛头犬蚁(Myrmecia forficata)

<400>55

atgaagattc cagcgatact tgcgacgtcc ctcctcatct ggggtcttgt cggcgccagc 60

gagctcgaat cggaagcgag tgcggcggcg tctgcgcaag cggaagcgtc ctcgtctggt 120

cgctccggca aactgtccgc gtctcaggct tccgccagcg cgtccgccag cgcgtcagcc 180

ggcagcagag gtggcagcaa aggtggctgg ggccagctcc gccgtggtga tgttaagagc 240

gaggcgaaga gcgccgccgc gatcgcggtc gaaggagcta aaatcggcac cggaatcgga 300

aataccgcgt ccgcatccgc ggaggcgctc tcacgaggac tcggcatcgg acaggcggcc 360

gcggaggcgc aagccgcagc cgcaggtcag gcagaggtcg ccgcgaaatc gtgcgaactt 420

gccgacaaga ccaccgccaa agcggtcgcc atggtcgaag cggcagccga ggccgaaatc 480

gaggtggcca atcaggaggt cgcagccgtc aaattatcga cttgggccgc taaagcagca 540

aggatagtcg aggaagacag cgccgccgtg agggcggctg ccggcaaatt gcttttggcc 600

gcgagagctg ccgccgccgc cgagagacgc gccaacgagg aatccgaggc ggccaacgaa 660

cttgctcaag cgtcatctgc cgctgccgcc gaggccgaag ccaaagcgaa cgccggccgt 720

gaggccgctg ccgctgcctt ggctatcgcc gaggccgccg tcgccatcga acaagaagcc 780

gtcattttgg ctcgcaaggc acaagatgcc cgtttgaatg ctgaagccgc agccgccgct 840

gcgatgaacg cccgtgtcat cgcttccgcc gaatccgagg ccagtgaaga tctggagaat 900

cgcgctagtg tggcgcgtgc cagtgcggcc ggtgccgctg aggcaaaggc tatcgccacc 960

gatgccggcg ccactgccga gatcgcggcc tacagttggg ccaagaaggg cgaactgatc 1020

aaccccggcc cgttgccgaa gatcatcagc gtcaacgccg atctgtccaa gagcgaggtc 1080

gaggccatga agatcacccg gggtcaagta caggaagtca agaaaatcag cactcacaaa 1140

ggtggctggg gatggggaaa ggaaggaagg tcgaaggtat cttccaacgc tagtgccaga 1200

gctagtgcca gcgccaatgc agccgccggt agcctcggca gcaaatgggg aagacaacta 1260

tccgcatcat ccgcgtcggc tgacgccaac gccgaagccg acagccagtt gctgaaagtg 1320

tggtga 1326

<210>56

<211>372

<212>PRT

<213>黄猄蚁(Oecophylla smaragdina)

<400>56

Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser Ala Ser Ala

1 5 10 15

Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val Gly Val Gly

20 25 30

Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala Ser Thr Thr

35 40 45

Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala Ala Leu Asn

50 55 60

Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu Gln Leu Leu

65 70 75 80

Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu Ala Asp Asp

85 90 95

Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser Val Ala Ala

100 105 110

Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu Asp Ala Ala

115 120 125

Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val Ser Ala Gln

130 135 140

Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile Gln Thr Ala

145 150 155 160

Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys Gln Glu Ala

165 170 175

Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu Ala Leu Ser

180 185 190

Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala Gln Asn Ala

195 200 205

Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala Glu Ala Arg

210 215 220

Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu Thr Ala Ala

225 230 235 240

Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala Gly Ser Val

245 250 255

Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala Glu Val Asn

260 265 270

Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn Gln Glu Ile

275 280 285

Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly Val Ile Ser

290 295 300

Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val Thr Ala Gly

305 310 315 320

Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser Ser Ser Ser

325 330 335

Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn Trp Gly Leu

340 345 350

Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser Ser Ala Ser

355 360 365

Ser Tyr Ser Ser

370

<210>57

<211>391

<212>PRT

<213>黄猄蚁(Oecophylla smaragdina)

<400>57

Met Lys Ile Pro Ala Ile Ile Ala Thr Thr Leu Leu Leu Trp Gly Phe

1 5 10 15

Ala Asp Ala Ser Lys Ser Tyr Leu Leu Gly Ser Ser Ala Ser Ala Ser

20 25 30

Ala Ser Ala Ser Ala Ser Ala Ser Ala Gly Gly Ser Thr Gly Gly Val

35 40 45

Gly Val Gly Ser Val Ile Ser Gly Gly Asn Asn Ile Ile Arg Gly Ala

50 55 60

Ser Thr Thr Ser Val Thr Leu Ala Ala Ala Ala Ala Glu Ala Lys Ala

65 70 75 80

Ala Leu Asn Ala Gly Lys Ala Thr Val Glu Glu Gln Arg Glu Ala Leu

85 90 95

Gln Leu Leu Thr Ala Ser Ala Glu Lys Asn Ala Glu Ala Arg Ser Leu

100 105 110

Ala Asp Asp Ala Ala Val Leu Val Gln Gly Ala Ala Glu Ala Gln Ser

115 120 125

Val Ala Ala Ala Lys Thr Val Ala Val Glu Gln Gly Ser Asn Ser Leu

130 135 140

Asp Ala Ala Ala Ala Glu Ala Glu Ala Ala Ala Ala Ala Ser Arg Val

145 150 155 160

Ser Ala Gln Gln Ala Leu Gln Ala Ala Gln Thr Ser Ala Ala Ala Ile

165 170 175

Gln Thr Ala Ala Gly Ser Ala Leu Thr Ala Leu Lys Leu Ala Arg Lys

180 185 190

Gln Glu Ala Glu Ser Asn Asn Ala Ala Glu Gln Ala Asn Lys Ala Leu

195 200 205

Ala Leu Ser Arg Ala Ala Ser Ala Ala Thr Gln Arg Ala Val Ala Ala

210 215 220

Gln Asn Ala Ala Ala Ala Ser Ala Ala Ser Ala Gly Ala Ala Gln Ala

225 230 235 240

Glu Ala Arg Asn Ala Tyr Ala Lys Ala Lys Ala Ala Ile Ala Ala Leu

245 250 255

Thr Ala Ala Gln Arg Asn Tyr Ala Ala Ala Lys Ala Ser Ala Ser Ala

260 265 270

Gly Ser Val Val Ala Glu Gln Asp Ala Gln Ser Arg Ala Ala Asp Ala

275 280 285

Glu Val Asn Ala Val Ala Gln Ala Ala Ala Arg Ala Ser Val Arg Asn

290 295 300

Gln Glu Ile Val Glu Ile Gly Ala Glu Phe Gly Asn Ala Ser Gly Gly

305 310 315 320

Val Ile Ser Thr Gly Thr Arg Ser Ser Gly Gly Lys Gly Val Ser Val

325 330 335

Thr Ala Gly Ala Gln Ala Ser Ala Ser Ala Ser Ala Thr Ser Ser Ser

340 345 350

Ser Ser Ser Ser Gly Ile Asn Lys Gly His Pro Arg Trp Gly His Asn

355 360 365

Trp Gly Leu Gly Ser Ser Glu Ala Ser Ala Asn Ala Glu Ala Glu Ser

370 375 380

Ser Ala Ser Ser Tyr Ser Ser

385 390

<210>58

<211>381

<212>PRT

<213>黄猄蚁(Oecophylla smaragdina)

<400>58

Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala Ser Ala Ser

1 5 10 15

Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala Ser Ile Gly

20 25 30

Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu Ala Val Gly

35 40 45

Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala Val Val Glu

50 55 60

Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg Thr Leu Asn

65 70 75 80

Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala Arg Ala Gln

85 90 95

Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala Leu Ile Lys

100 105 110

Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu Tyr Leu Ala

115 120 125

Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala Thr Ala Ala

130 135 140

Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys Val Ser Ser

145 150 155 160

Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala Glu Ala Lys

165 170 175

Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala Val Leu Ala

180 185 190

Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala Gln Gln Ser

195 200 205

Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys Ala Gln Ala

210 215 220

Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile Ala Glu Ala

225 230 235 240

Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val Cys Thr Ser

245 250 255

Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser Ala Ala Glu

260 265 270

Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala Ala Glu Ala

275 280 285

Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln Ala Trp Ala

290 295 300

Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu Ala Glu Ala

305 310 315 320

Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser Gly Ser Ser

325 330 335

Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly Ala Ser Ser

340 345 350

Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe Ser Glu Ala

355 360 365

Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala

370 375 380

<210>59

<211>400

<212>PRT

<213>黄猄蚁(Oecophylla smaragdina)

<400>59

Met Lys Ile Pro Ala Ile Phe Val Thr Ser Leu Leu Ala Trp Gly Leu

1 5 10 15

Ala Ser Gly Gly Val Ile Gly Pro Asp Thr Ser Ser Ser Ser Gln Ala

20 25 30

Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ser Ser Ala

35 40 45

Ser Ile Gly Tyr Asn Glu Leu His Lys Ser Ile Asn Ala Pro Ala Leu

50 55 60

Ala Val Gly Val Lys Asn Gly Gly Val Asp Val Ala Lys Gly Ala Ala

65 70 75 80

Val Val Glu Ser Ala Ile Ser Asp Val Ser Thr Leu Thr Asp Asp Arg

85 90 95

Thr Leu Asn Gly Leu Ala Ile Ile Gly Asn Ser Ala Glu Ser Leu Ala

100 105 110

Arg Ala Gln Ala Ser Ser Ser Ala Ser Ala Gly Ala Lys Ala Asn Ala

115 120 125

Leu Ile Lys Gln Ser Ile Ala Ala Ile Glu Ile Thr Glu Lys Ala Glu

130 135 140

Tyr Leu Ala Ser Ile Val Ala Thr Lys Ala Ala Lys Ala Ala Glu Ala

145 150 155 160

Thr Ala Ala Ala Thr Ala Arg Ala Thr Ala Val Ala Glu Ala Ala Lys

165 170 175

Val Ser Ser Glu Gln Phe Ala Ala Glu Ala Arg Ala Ala Ala Asp Ala

180 185 190

Glu Ala Lys Ala Asn Ala Ala Ser Ile Ile Ala Asn Lys Ala Asn Ala

195 200 205

Val Leu Ala Glu Ala Ala Thr Gly Leu Ser Ala Ser Ala Gly Lys Ala

210 215 220

Gln Gln Ser Ala Thr Arg Ala Leu Gln Ala Ala Arg Ala Ala Ala Lys

225 230 235 240

Ala Gln Ala Glu Leu Thr Gln Lys Ala Ala Gln Ile Leu Val Leu Ile

245 250 255

Ala Glu Ala Lys Ala Ala Val Ser Arg Ala Ser Ala Asp Gln Ser Val

260 265 270

Cys Thr Ser Gln Ala Gln Ala Ala Ser Gln Ile Gln Ser Arg Ala Ser

275 280 285

Ala Ala Glu Ser Ala Ala Ser Ala Gln Ser Glu Ala Asn Thr Ile Ala

290 295 300

Ala Glu Ala Val Ala Arg Ala Asp Ala Glu Ala Ala Ser Gln Ala Gln

305 310 315 320

Ala Trp Ala Glu Ser Phe Lys Arg Glu Leu Ser Ser Val Val Leu Glu

325 330 335

Ala Glu Ala Asn Ala Ser Ala Ser Ala Ser Ala Gly Ala Leu Ala Ser

340 345 350

Gly Ser Ser Ser Ser Gly Ala Ser Ser Ser Ala Asp Ala Ser Ala Gly

355 360 365

Ala Ser Ser Tyr Gly Ser Leu Gly Gly Tyr Arg His Gly Gly Ser Phe

370 375 380

Ser Glu Ala Ser Ala Ala Ala Ser Ala Ala Ser Arg Ala Glu Ala Ala

385 390 395 400

<210>60

<211>376

<212>PRT

<213>黄猄蚁(Oecophylla smaragdina)

<400>60

Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala Ser Ala Ser

1 5 10 15

Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser Lys Asn Val

20 25 30

His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile Asp Lys Ser

35 40 45

Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp Glu Ile Asn

50 55 60

Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser Leu Ala Leu

65 70 75 80

Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala Leu Ala Ile

85 90 95

Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val Arg Ala Ala

100 105 110

Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr Val Arg Ala

115 120 125

Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg Ala Ala Ala

130 135 140

Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala Asp Ala Ala

145 150 155 160

Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln Asp Ala Arg

165 170 175

Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala Glu Asn Ala

180 185 190

Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser Ile Ala Lys

195 200 205

Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asp Ala Ala Ala

210 215 220

Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn Ala Val Ser

225 230 235 240

Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala Ala Glu Glu

245 250 255

Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln Leu Thr Ala

260 265 270

Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala Ser Ala Ser

275 280 285

Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala Ala Leu Ala

290 295 300

Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly Leu Gly Asn

305 310 315 320

Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser Ala Leu Ala

325 330 335

Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr Lys Ile Gly

340 345 350

Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Gln

355 360 365

Ser Ser Ser Gln Gly Leu Val Tyr

370 375

<210>61

<211>395

<212>PRT

<213>黄猄蚁(Oecophylla smaragdina)

<400>61

Met Lys Ile Pro Ala Ile Leu Val Thr Ser Phe Leu Ala Trp Gly Leu

1 5 10 15

Ala Ser Gly Gly Val Pro Lys Glu Leu Gly Thr Ser Ile Ser Ser Ala

20 25 30

Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Thr Ala Ser Ser Ser Ser

35 40 45

Lys Asn Val His Leu Leu Pro Leu Lys Ser Glu His Gly Ile Val Ile

50 55 60

Asp Lys Ser Lys Phe Asn Ile Arg Lys Val Val Leu Ser Ala Ile Asp

65 70 75 80

Glu Ile Asn Gly Ala Pro Asn Ile Gly Leu Gly Leu Lys Gln Val Ser

85 90 95

Leu Ala Leu Ala Lys Ala Gln Ala Ser Ala Gln Ser Ser Ala Glu Ala

100 105 110

Leu Ala Ile Ile Lys Lys Ile Val Ala Leu Leu Ile Ser Ala Tyr Val

115 120 125

Arg Ala Ala Glu Ala Ala Ala Arg Ala Ser Ala Glu Ala Leu Ala Thr

130 135 140

Val Arg Ala Ala Glu Gln Ala Gln Lys Ile Ala Glu Ala Lys Gly Arg

145 150 155 160

Ala Ala Ala Glu Ala Leu Ser Glu Leu Val Glu Ala Ser Gln Lys Ala

165 170 175

Asp Ala Ala Ala Ala Gly Thr Thr Asp Ala Ile Glu Arg Thr Tyr Gln

180 185 190

Asp Ala Arg Ala Ala Thr Ser Ala Gln Thr Lys Ala Ser Gly Glu Ala

195 200 205

Glu Asn Ala Asn Arg Asn Ala Ala Ala Thr Leu Ala Ala Val Leu Ser

210 215 220

Ile Ala Lys Ala Ala Ser Gly Gln Gly Gly Thr Arg Ala Ala Val Asn

225 230 235 240

Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Leu His Ala Lys Ala Asn

245 250 255

Ala Val Ser Gln Ala Thr Ser Lys Ala Ala Ala Glu Ala Arg Val Ala

260 265 270

Ala Glu Glu Ala Ala Ser Ala Gln Ala Ser Ala Ser Ala Ser Ala Gln

275 280 285

Leu Thr Ala Gln Leu Glu Glu Lys Val Ser Ala Asp Gln Gln Ala Ala

290 295 300

Ser Ala Ser Thr Asp Thr Ser Ala Ala Ile Ala Glu Ala Glu Ala Ala

305 310 315 320

Ala Leu Ala Ser Thr Val Asn Ala Ile Asn Asp Gly Val Val Ile Gly

325 330 335

Leu Gly Asn Thr Ala Ser Ser Ser Ala Gln Ala Ser Ala Gln Ala Ser

340 345 350

Ala Leu Ala Arg Ala Lys Asn Ala Arg Pro Lys Ile Lys Gly Trp Tyr

355 360 365

Lys Ile Gly Gly Ala Thr Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala

370 375 380

Ser Ala Gln Ser Ser Ser Gln Gly Leu Val Tyr

385 390 395

<210>62

<211>424

<212>PRT

<213>黄猄蚁(Oecophylla smaragdina)

<400>62

Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser Ala Glu Ala

1 5 10 15

Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile Gly Ser Gly

20 25 30

Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser Ala Ser

35 40 45

Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn Val Gly Thr

50 55 60

Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu Ser Arg Gly

65 70 75 80

Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala Ala Ala Gly

85 90 95

Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala Lys Ser Thr

100 105 110

Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala Glu Val Asp

115 120 125

Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala Glu Ala Ala

130 135 140

Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu Arg Gly Ala

145 150 155 160

Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys Ala Gln Glu

165 170 175

Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala Gln Ala Thr

180 185 190

Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala Ala Gln Glu

195 200 205

Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu Asn Ile Glu

210 215 220

Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr Arg Leu Arg

225 230 235 240

Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala Ile Ala Ser

245 250 255

Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala Asn Ala Ala

260 265 270

Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val Ala Thr Glu

275 280 285

Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser Glu Lys Gly

290 295 300

Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser Val Thr Ala

305 310 315 320

Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala Ala Ser Ala

325 330 335

Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly Ala Gly Ala

340 345 350

Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val Ala Gly Ala

355 360 365

Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser Ala Gly Ala

370 375 380

Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln Ser Lys Leu

385 390 395 400

His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser Ala Glu Ala

405 410 415

Glu Ala Asn Ser Ser Ala Tyr Ala

420

<210>63

<211>443

<212>PRT

<213>黄猄蚁(Oecophylla smaragdina)

<400>63

Met Lys Ile Pro Ala Ile Leu Ala Thr Ser Leu Phe Val Trp Gly Leu

1 5 10 15

Val Gly Ala Ser Glu Leu Val Gly Ser Asp Ala Ser Ala Thr Ala Ser

20 25 30

Ala Glu Ala Ser Ala Ser Ser Ser Ala Tyr Gly Ser Lys Tyr Gly Ile

35 40 45

Gly Ser Gly Ala Val Ser Gly Ala Ser Ala Ser Ala Ser Ala Ser Ala

50 55 60

Ser Ala Ser Ala Ser Ala Ser Ser Ala Pro Ala Ile Glu Gly Val Asn

65 70 75 80

Val Gly Thr Gly Val Ser Asn Thr Ala Ser Ala Ser Ala Glu Ala Leu

85 90 95

Ser Arg Gly Leu Gly Ile Gly Gln Ala Ala Ala Glu Ala Gln Ala Ala

100 105 110

Ala Ala Gly Gln Ala Ala Ile Ala Ala Lys Ser Cys Ala Leu Ala Ala

115 120 125

Lys Ser Thr Ala Gln Ala Val Ala Leu Val Glu Lys Val Ala Arg Ala

130 135 140

Glu Val Asp Leu Ala Glu Ser Ala Arg Lys Ala Thr Arg Leu Ser Ala

145 150 155 160

Glu Ala Ala Lys Ala Ala Ala Glu Val Glu Lys Asp Leu Val Gly Leu

165 170 175

Arg Gly Ala Ala Gly Lys Leu Asn Leu Ala Ala Arg Ala Gly Ser Lys

180 185 190

Ala Gln Glu Arg Ala Asn Glu Asp Ser Ile Glu Ala Asn Glu Leu Ala

195 200 205

Gln Ala Thr Ala Ala Ala Gly Ala Glu Ala Glu Ala Lys Ala Asn Ala

210 215 220

Ala Gln Glu Ala Gly Ala Ser Ala Leu Ala Ile Ala Gln Ala Ala Leu

225 230 235 240

Asn Ile Glu Gln Glu Thr Val Lys Leu Thr Arg Gln Ala Gln Asn Thr

245 250 255

Arg Leu Arg Ser Glu Asn Ile Leu Ala Ala Ala Ser Asn Ala Arg Ala

260 265 270

Ile Ala Ser Ala Glu Ala Glu Ala Ser Ser Asp Leu Asn Asn Arg Ala

275 280 285

Asn Ala Ala Arg Ser Asn Ala Arg Ala Ala Ala Glu Thr Arg Ala Val

290 295 300

Ala Thr Glu Ala Ala Ser Thr Ala Glu Ile Ala Ala Tyr Ser Ser Ser

305 310 315 320

Glu Lys Gly Glu Ile Thr Asn Pro Gly Pro Leu Pro Lys Ile Val Ser

325 330 335

Val Thr Ala Gly Leu Thr Gln Asn Glu Ile Ala Gly Ser Gly Ala Ala

340 345 350

Ala Ser Ala Ser Ala Ser Ala Leu Ala Ser Ala Ser Ala Gly Ala Gly

355 360 365

Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Ala Val

370 375 380

Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ser Ala Gly Ala Ser

385 390 395 400

Ala Gly Ala Asn Ala Gly Ala Gly Ala Ser Ser Leu Leu Leu Pro Gln

405 410 415

Ser Lys Leu His Pro Ile Ser Arg Ser Ser Ala Ser Ala Ser Ala Ser

420 425 430

Ala Glu Ala Glu Ala Asn Ser Ser Ala Tyr Ala

435 440

<210>64

<211>1119

<213>黄猄蚁(Oecophylla smaragdina)

<400>64

agcaagtcgt acctcttagg ctcatccgcg tctgcttccg cttccgcttc cgcctcggca 60

tcagcgggag gaagcaccgg cggcgtcggc gtcggatctg taatatccgg tggcaacaac 120

atcatcagag gagcttcgac cacatccgtg acattggcag ccgccgcagc ggaggccaag 180

gcagctctga atgctggaaa agcgactgtc gaagagcaaa gggaagcgtt acagttgctc 240

accgcgtccg ctgaaaaaaa cgccgaggcg cgttccttgg ccgacgatgc ggccgttcta 300

gttcagggtg ccgctgaggc gcaatcggtc gccgccgcga agacggtcgc ggtcgagcaa 360

ggatccaact ctctggatgc agctgcagcc gaagcggaag ccgccgccgc cgcatccagg 420

gtatcggccc agcaggcact ccaggccgcg cagacctccg ccgccgctat tcaaaccgct 480

gccggtagcg ccctgacggc tctcaaattg gcacgcaaac aggaagcgga atccaataat 540

gccgccgaac aggcaaataa agcattggcc ttaagtcgcg cagccagcgc tgccactcaa 600

cgagccgtgg cagctcagaa cgcggctgcc gcatcagcgg cttcggctgg agccgcacaa 660

gctgaggcaa ggaacgccta cgccaaagcc aaagcagcga tagctgctct tacggccgcc 720

caaagaaatt acgccgcggc caaggctagc gcaagcgcgg gtagcgtggt ggccgaacaa 780

gatgctcaat ctagagcggc cgatgccgag gtgaacgccg ttgcccaagc cgctgcccga 840

gccagcgttc gcaatcagga gatcgttgaa atcggcgcgg aattcggcaa cgccagcggc 900

ggagtgatct cgaccggcac acgttcttcc ggaggcaagg gtgtctccgt taccgctgga 960

gctcaggcta gcgcgtccgc ttccgcgacc tcctcctcct cctcctcctc cggcatcaac 1020

aaaggacatc ccagatgggg gcacaattgg ggtttaggtt cttcggaagc gtcagcaaac 1080

gctgaagccg aaagcagcgc ttcctcttat tcatcttaa 1119

<210>65

<211>1176

<212>DNA

<213>黄猄蚁(Oecophylla smaragdina)

<400>65

atgaagatcc cagcgataat cgcaacgacc ctccttctct ggggtttcgc cgacgccagc 60

aagtcgtacc tcttaggctc atccgcgtct gcttccgctt ccgcttccgc ctcggcatca 120

gcgggaggaa gcaccggcgg cgtcggcgtc ggatctgtaa tatccggtgg caacaacatc 180

atcagaggag cttcgaccac atccgtgaca ttggcagccg ccgcagcgga ggccaaggca 240

gctctgaatg ctggaaaagc gactgtcgaa gagcaaaggg aagcgttaca gttgctcacc 300

gcgtccgctg aaaaaaacgc cgaggcgcgt tccttggccg acgatgcggc cgttctagtt 360

cagggtgccg ctgaggcgca atcggtcgcc gccgcgaaga cggtcgcggt cgagcaagga 420

tccaactctc tggatgcagc tgcagccgaa gcggaagccg ccgccgccgc atccagggta 480

tcggcccagc aggcactcca ggccgcgcag acctccgccg ccgctattca aaccgctgcc 540

ggtagcgccc tgacggctct caaattggca cgcaaacagg aagcggaatc caataatgcc 600

gccgaacagg caaataaagc attggcctta agtcgcgcag ccagcgctgc cactcaacga 660

gccgtggcag ctcagaacgc ggctgccgca tcagcggctt cggctggagc cgcacaagct 720

gaggcaagga acgcctacgc caaagccaaa gcagcgatag ctgctcttac ggccgcccaa 780

agaaattacg ccgcggccaa ggctagcgca agcgcgggta gcgtggtggc cgaacaagat 840

gctcaatcta gagcggccga tgccgaggtg aacgccgttg cccaagccgc tgcccgagcc 900

agcgttcgca atcaggagat cgttgaaatc ggcgcggaat tcggcaacgc cagcggcgga 960

gtgatctcga ccggcacacg ttcttccgga ggcaagggtg tctccgttac cgctggagct 1020

caggctagcg cgtccgcttc cgcgacctcc tcctcctcct cctcctccgg catcaacaaa 1080

ggacatccca gatgggggca caattggggt ttaggttctt cggaagcgtc agcaaacgct 1140

gaagccgaaa gcagcgcttc ctcttattca tcttaa 1176

<210>66

<211>1146

<212>DNA

<213>黄猄蚁(Oecophylla smaragdina)

<400>66

ggagtcatag gtcccgacac gtcctcatcg tcccaggcat cggcatcggc atcggcgtca 60

gcatcggcgt cggcatcatc gtcggcatcg atcggttaca acgaactcca taaatcgatc 120

aatgcgcccg ccttggcggt cggcgtcaag aacggcggag tggatgtcgc caagggcgcg 180

gccgttgtcg aatcagcgat atccgacgta tcgactctaa ccgatgatcg tacgttgaac 240

ggtctcgcta tcatcgggaa tagcgccgag agtctggcaa gagcacaggc ttcctcgagc 300

gccagcgccg gcgcaaaagc caatgctctc atcaaacaat cgatagcggc tatagagatc 360

accgaaaagg cagagtacct tgcgtcgatc gtcgccacca aggcagcgaa ggccgccgag 420

gccacagcgg ccgcgaccgc tcgcgccact gccgtcgccg aggctgccaa ggtttccagc 480

gagcaattcg cggccgaggc acgcgcggcc gccgacgccg aagccaaggc caacgccgct 540

tccatcatcg ccaacaaagc gaacgccgtc ctcgcggagg cagccaccgg acttagcgcc 600

agcgctggca aagcccaaca atcggcgacc agggcgttgc aagccgcacg agctgccgct 660

aaggctcaag ccgaacttac ccagaaagcc gctcaaatct tagtcctcat tgctgaagcc 720

aaagccgccg tgagccgagc aagcgccgat caatccgtct gtacgtccca ggcacaagcc 780

gccagtcaga ttcaatcgag agcctccgcg gccgaatccg cggcatcggc tcaatcggaa 840

gccaacacca ttgcggccga ggcggtcgct agagctgacg ccgaggcggc cagtcaagct 900

caagcgtggg ccgaatcctt caaacgcgaa ctctcgagtg tcgttttgga ggccgaggcc 960

aatgcctcgg ctagtgcctc ggctggtgcc ctggccagtg gtagcagcag ctcgggcgcg 1020

agttccagcg cggatgccag cgccggagcg agcagctatg gatccttggg cggatatcga 1080

cacggcggaa gcttcagcga ggcatcggca gccgcgtcag cggccagtcg cgccgaggct 1140

gcgtaa 1146

<210>67

<211>1203

<212>DNA

<213>黄猄蚁(Oecophylla smaragdina)

<400>67

atgaagattc cagcgatatt cgtgacgtct ctgctcgcct ggggactcgc cagcggcgga 60

gtcataggtc ccgacacgtc ctcatcgtcc caggcatcgg catcggcatc ggcgtcagca 120

tcggcgtcgg catcatcgtc ggcatcgatc ggttacaacg aactccataa atcgatcaat 180

gcgcccgcct tggcggtcgg cgtcaagaac ggcggagtgg atgtcgccaa gggcgcggcc 240

gttgtcgaat cagcgatatc cgacgtatcg actctaaccg atgatcgtac gttgaacggt 300

ctcgctatca tcgggaatag cgccgagagt ctggcaagag cacaggcttc ctcgagcgcc 360

agcgccggcg caaaagccaa tgctctcatc aaacaatcga tagcggctat agagatcacc 420

gaaaaggcag agtaccttgc gtcgatcgtc gccaccaagg cagcgaaggc cgccgaggcc 480

acagcggccg cgaccgctcg cgccactgcc gtcgccgagg ctgccaaggt ttccagcgag 540

caattcgcgg ccgaggcacg cgcggccgcc gacgccgaag ccaaggccaa cgccgcttcc 600

atcatcgcca acaaagcgaa cgccgtcctc gcggaggcag ccaccggact tagcgccagc 660

gctggcaaag cccaacaatc ggcgaccagg gcgttgcaag ccgcacgagc tgccgctaag 720

gctcaagccg aacttaccca gaaagccgct caaatcttag tcctcattgc tgaagccaaa 780

gccgccgtga gccgagcaag cgccgatcaa tccgtctgta cgtcccaggc acaagccgcc 840

agtcagattc aatcgagagc ctccgcggcc gaatccgcgg catcggctca atcggaagcc 900

aacaccattg cggccgaggc ggtcgctaga gctgacgccg aggcggccag tcaagctcaa 960

gcgtgggccg aatccttcaa acgcgaactc tcgagtgtcg ttttggaggc cgaggccaat 1020

gcctcggcta gtgcctcggc tggtgccctg gccagtggta gcagcagctc gggcgcgagt 1080

tccagcgcgg atgccagcgc cggagcgagc agctatggat ccttgggcgg atatcgacac l140

ggcggaagct tcagcgaggc atcggcagcc gcgtcagcgg ccagtcgcgc cgaggctgcg 1200

taa 1203

<210>68

<211>1131

<212>DNA

<213>黄猄蚁(Oecophylla smaragdina)

<400>68

ggtgtcccta aagagttggg aacttccatt tcttccgcgt ccgcatccgc atccgcatcc 60

gcatccgcga ccgcgtcctc cagtagcaag aatgttcact tattaccatt gaaaagcgag 120

catggcatcg taattgacaa gtcaaaattc aacatcagaa aggtagtgtt gagcgcaatc 180

gatgagatca acggcgcgcc caacatcggt ctgggattga aacaggtcag tttggcgctc 240

gcaaaagccc aggctagtgc tcaatcgagc gccgaggcat tggcaatcat caagaaaatc 300

gtcgcgctcc tcatctcggc ctacgtcaga gcagccgagg ccgcggctcg agcatccgcc 360

gaagctttag ctaccgttag ggctgcggaa caagcgcaaa aaattgctga agcgaagggt 420

agagcggctg ctgaggcgct ctccgagtta gtcgaggcgt cccagaaggc cgatgcggcg 480

gccgcgggaa cgacggacgc gatcgaacgc acctaccagg atgccagagc ggccacttcc 540

gcacagacca aggccagcgg cgaagccgag aatgctaatc gcaatgctgc cgccaccctc 600

gcggcggtct tgagcatcgc taaggccgcc tccggtcaag gaggcactcg agccgctgtc 660

gatgcagctg ctgccgctgc cgccgcagcc gctctgcatg ctaaagctaa cgcggtttcg 720

caagctacca gcaaagcagc cgctgaagct agagtcgcgg ctgaggaggc agcatccgcc 780

caggcatccg cctcagcaag cgcacagctg accgcacaat tagaggagaa agtcagcgcc 840

gatcaacaag cagcctccgc cagtactgat acctccgctg ctatagccga ggctgaagct 900

gccgcgttag cgtccaccgt caacgcgatc aacgacggag tggtcatcgg attaggaaat 960

accgccagtt cttctgccca agcttccgca caggccagtg ctctcgctcg cgcaaaaaat 1020

gcgcgcccta aaataaaggg ctggtacaaa atcggaggcg cgacttccgc ttctgcaagc 1080

gcatcggcca gcgcttccgc ccagtcatcc tcgcaaggac tggtatacta g 1131

<210>69

<211>1188

<212>DNA

<213>黄猄蚁(Oecophylla smaragdina)

<400>69

atgaagattc cagcgatact cgtgacgtcc ttcctcgcct ggggactggc cagcgggggt 60

gtccctaaag agttgggaac ttccatttct tccgcgtccg catccgcatc cgcatccgca 120

tccgcgaccg cgtcctccag tagcaagaat gttcacttat taccattgaa aagcgagcat 180

ggcatcgtaa ttgacaagtc aaaattcaac atcagaaagg tagtgttgag cgcaatcgat 240

gagatcaacg gcgcgcccaa catcggtctg ggattgaaac aggtcagttt ggcgctcgca 300

aaagcccagg ctagtgctca atcgagcgcc gaggcattgg caatcatcaa gaaaatcgtc 360

gcgctcctca tctcggccta cgtcagagca gccgaggccg cggctcgagc atccgccgaa 420

gctttagcta ccgttagggc tgcggaacaa gcgcaaaaaa ttgctgaagc gaagggtaga 480

gcggctgctg aggcgctctc cgagttagtc gaggcgtccc agaaggccga tgcggcggcc 540

gcgggaacga cggacgcgat cgaacgcacc taccaggatg ccagagcggc cacttccgca 600

cagaccaagg ccagcggcga agccgagaat gctaatcgca atgctgccgc caccctcgcg 660

gcggtcttga gcatcgctaa ggccgcctcc ggtcaaggag gcactcgagc cgctgtcgat 720

gcagctgctg ccgctgccgc cgcagccgct ctgcatgcta aagctaacgc ggtttcgcaa 780

gctaccagca aagcagccgc tgaagctaga gtcgcggctg aggaggcagc atccgcccag 840

gcatccgcct cagcaagcgc acagctgacc gcacaattag aggagaaagt cagcgccgat 900

caacaagcag cctccgccag tactgatacc tccgctgcta tagccgaggc tgaagctgcc 960

gcgttagcgt ccaccgtcaa cgcgatcaac gacggagtgg tcatcggatt aggaaatacc 1020

gccagttctt ctgcccaagc ttccgcacag gccagtgctc tcgctcgcgc aaaaaatgcg 1080

cgccctaaaa taaagggctg gtacaaaatc ggaggcgcga cttccgcttc tgcaagcgca 1140

tcggccagcg cttccgccca gtcatcctcg caaggactgg tatactag 1188

<210>70

<211>1275

<212>DNA

<213>黄猄蚁(Oecophylla smaragdina)

<400>70

agcgaactcg tcggatcgga cgcgagcgcg acggcatctg ctgaagcgtc agcatcgtca 60

tccgcatacg gtagcaagta tggtattggt agtggtgctg tctccggtgc atcagccagc 120

gcctctgcca gcgcgtctgc tagcgcatca gccagcagtg ctcccgcgat cgaaggagta 180

aacgttggca ccggagtcag taacaccgct tccgcgtccg cagaagctct ctcccgtgga 240

ctcggcatcg gacaagcggc tgccgaagcg caagccgctg ccgctggcca agcggcgatc 300

gctgcgaaat cgtgcgcgct agcggccaag agcaccgctc aagcggttgc cctggttgag 360

aaagtggccc gcgccgaggt agatctggcc gaaagcgcga gaaaggctac aagattatcg 420

gcagaagcag ccaaggcagc ggcggaagtc gagaaggacc tcgtcggtct gagaggggct 480

gccggtaaac tgaatctggc tgcgagagcc ggttctaaag cccaagaacg cgccaacgaa 540

gactctatag aggctaacga acttgcccaa gcaacggccg ccgccggtgc cgaggctgaa 600

gccaaggcga atgccgccca ggaggcaggc gcctccgctt tggccatcgc ccaagccgcc 660

cttaacatcg agcaagagac tgttaaattg acccgccagg cccagaatac tcgtctcaga 720

tctgaaaata ttctcgccgc ggccagcaat gcccgcgcca tcgcttccgc tgaggccgag 780

gccagtagtg atttgaataa tcgtgcgaat gcagcgcgtt ccaatgcccg agctgctgcc 840

gagaccagag ccgtagctac cgaagccgct tctaccgccg agatcgcagc ttatagttca 900

tccgagaaag gcgagatcac caatcccggt cctctgccca agatcgtcag tgttaccgca 960

ggtctgaccc agaacgaaat agcgggatca ggagcggccg ctagtgctag tgccagtgct 1020

cttgccagtg ccagtgccgg tgccggtgcc ggtgcaggtg caggagccgg tgcaagtgca 1080

ggagccggtg cagttgcagg tgcaggagcc ggtgcaggag ccggtgctag tgccggagcg 1140

agtgccggag cgaatgccgg tgccggtgcc agcagtttac tcttgccgca gagtaaactc 1200

catccaatct ccaggtcttc cgcctctgcc tccgcttccg ccgaggccga agctaacagt 1260

tcggcgtatg cgtaa 1275

<210>71

<211>1332

<212>DNA

<213>黄猄蚁(Oecophylla smaragdina)

<400>71

atgaagattc cagcgatact tgcgacgtcc cttttcgtct ggggtcttgt cggcgccagc 60

gaactcgtcg gatcggacgc gagcgcgacg gcatctgctg aagcgtcagc atcgtcatcc 120

gcatacggta gcaagtatgg tattggtagt ggtgctgtct ccggtgcatc agccagcgcc 180

tctgccagcg cgtctgctag cgcatcagcc agcagtgctc ccgcgatcga aggagtaaac 240

gttggcaccg gagtcagtaa caccgcttcc gcgtccgcag aagctctctc ccgtggactc 300

ggcatcggac aagcggctgc cgaagcgcaa gccgctgccg ctggccaagc ggcgatcgct 360

gcgaaatcgt gcgcgctagc ggccaagagc accgctcaag cggttgccct ggttgagaaa 420

gtggcccgcg ccgaggtaga tctggccgaa agcgcgagaa aggctacaag attatcggca 480

gaagcagcca aggcagcggc ggaagtcgag aaggacctcg tcggtctgag aggggctgcc 540

ggtaaactga atctggctgc gagagccggt tctaaagccc aagaacgcgc caacgaagac 600

tctatagagg ctaacgaact tgcccaagca acggccgccg ccggtgccga ggctgaagcc 660

aaggcgaatg ccgcccagga ggcaggcgcc tccgctttgg ccatcgccca agccgccctt 720

aacatcgagc aagagactgt taaattgacc cgccaggccc agaatactcg tctcagatct 780

gaaaatattc tcgccgcggc cagcaatgcc cgcgccatcg cttccgctga ggccgaggcc 840

agtagtgatt tgaataatcg tgcgaatgca gcgcgttcca atgcccgagc tgctgccgag 900

accagagccg tagctaccga agccgcttct accgccgaga tcgcagctta tagttcatcc 960

gagaaaggcg agatcaccaa tcccggtcct ctgcccaaga tcgtcagtgt taccgcaggt 1020

ctgacccaga acgaaatagc gggatcagga gcggccgcta gtgctagtgc cagtgctctt 1080

gccagtgcca gtgccggtgc cggtgccggt gcaggtgcag gagccggtgc aagtgcagga 1140

gccggtgcag ttgcaggtgc aggagccggt gcaggagccg gtgctagtgc cggagcgagt 1200

gccggagcga atgccggtgc cggtgccagc agtttactct tgccgcagag taaactccat 1260

ccaatctcca ggtcttccgc ctctgcctcc gcttccgccg aggccgaagc taacagttcg 1320

gcgtatgcgt aa 1332

<210>72

<211>562

<212>PRT

<213>玛草蛉(Mallada signata)

<400>72

Ala Val Leu Ile Ser Gly Ser Ala Ala Gly Ala Ser Ser His Asn Ala

1 5 10 15

Ala Gly Ala Ala Ala Ala Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala

20 25 30

Ala Gly Leu Gly Ala Ala Ser Gly Ala Ala Arg Arg Asn Val Ala Val

35 40 45

Gly Ala Asn Gly Ala Ala Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg

50 55 60

Arg Ala Gly Ala Ile Gly Leu Asn Gly Ala Ala Gly Ala Asn Val Ala

65 70 75 80

Val Ala Gly Gly Lys Lys Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala

85 90 95

Gly Ala Ser Leu Val Ser Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly

100 105 110

Leu Asn Gly Ala Ala Gly Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys

115 120 125

Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala Asn Val Gly Ala

130 135 140

Ala Ala Ala Lys Lys Asn Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser

145 150 155 160

Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu

165 170 175

Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser

180 185 190

Gly Ala Val Gly Leu Asn Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala

195 200 205

Ala Ala Lys Lys Ser Gly Ala Val Ala Ala Asn Ser Ala Ala Ser Ala

210 215 220

Asn Ala Ala Ala Ala Ala Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn

225 230 235 240

Ala Ala Ala Ser Glu Ser Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala

245 250 255

Ala Val Ala Glu Asn Ala Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu

260 265 270

Arg Lys Asn Ala Leu Ala Ile Ala Ser Asp Ala Ala Ala Val Arg Ala

275 280 285

Asp Ala Ala Ala Ala Ala Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala

290 295 300

Ala Ser Arg Gly Ser Asp Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr

305 310 315 320

Leu Ala Ser Asp Ala Ala Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala

325 330 335

Ser Asp Ala Ala Thr Asp Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn

340 345 350

Ala Ala Thr Ala Arg Ala Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala

355 360 365

Thr Asp Ala Asp Asn Ala Ala Ser Lys Ala Ser Asp Val Ser Ala Ile

370 375 380

Glu Ala Asp Asn Ala Ala Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr

385 390 395 400

Asn Arg Ala Ala Glu Ala Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala

405 410 415

Ala Ala Asn Ala Ala Asp Ala Ala Ala Gln Cys Asn Asn Lys Val Ala

420 425 430

Arg Val Ser Asp Ala Leu Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly

435 440 445

Ser Asp Ala Ala Ala Glu Ala Gln Asp Ala Val Ala Arg Ala Ser Asp

450 455 460

Ala Ala Ala Ala Gln Ala Asp Gly Val Ala Ile Ala Val Asn Gly Ala

465 470 475 480

Thr Ala Arg Asp Ser Ala Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala

485 490 495

Gln Ala Lys Ala Ala Gly Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg

500 505 510

Ala Gly Ala Ala Arg Gly Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala

515 520 525

Gly Gly Leu Ala Ala Gly Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala

530 535 540

Ser Gly Leu Ala Arg Gly Ala Ala Ala Glu Val Cys Ala Ala Arg Ile

545 550 555 560

Ala Leu

<210>73

<211>588

<212>PRT

<213>玛草蛉(Mallada signata)

<400>73

Met Ala Ala Ser Asn Lys Ile Ile Phe Ser Phe Leu Ala Ile Val Leu

1 5 10 15

Leu Gln Leu Ala Thr His Cys Ser Ser Thr Ala Val Leu Ile Ser Gly

20 25 30

Ser Ala Ala Gly Ala Ser Ser His Asn Ala Ala Gly Ala Ala Ala Ala

35 40 45

Ala Arg Ala Ala Leu Gly Ala Ser Gly Ala Ala Gly Leu Gly Ala Ala

50 55 60

Ser Gly Ala Ala Arg Arg Asn Val Ala Val Gly Ala Asn Gly Ala Ala

65 70 75 80

Ala Ala Ser Ala Ala Ala Ala Ala Ala Arg Arg Ala Gly Ala Ile Gly

85 90 95

Leu Asn Gly Ala Ala Gly Ala Asn Val Ala Val Ala Gly Gly Lys Lys

100 105 110

Gly Gly Ala Ala Gly Leu Asn Ala Gly Ala Gly Ala Ser Leu Val Ser

115 120 125

Ala Ala Ala Arg Arg Asn Gly Ala Leu Gly Leu Asn Gly Ala Ala Gly

130 135 140

Ala Asn Leu Ala Ala Ala Gly Gly Lys Lys Gly Gly Ala Ile Gly Leu

145 150 155 160

Asn Ala Gly Ala Ser Ala Asn Val Gly Ala Ala Ala Ala Lys Lys Asn

165 170 175

Gly Ala Ile Gly Leu Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala

180 185 190

Ala Ala Lys Lys Gly Gly Ala Ile Gly Leu Asn Ala Gly Ala Ser Ala

195 200 205

Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly Ala Val Gly Leu Asn

210 215 220

Ala Gly Ala Ser Ala Asn Ala Ala Ala Ala Ala Ala Lys Lys Ser Gly

225 230 235 240

Ala Val Ala Ala Asn Ser Ala Ala Ser Ala Asn Ala Ala Ala Ala Ala

245 250 255

Gln Lys Lys Ala Ala Ala Asp Ala Ala Asn Ala Ala Ala Ser Glu Ser

260 265 270

Ala Ala Ala Ala Ala Ala Lys Lys Ala Ala Ala Val Ala Glu Asn Ala

275 280 285

Ala Ala Thr Ala Asn Ala Ala Ser Ala Leu Arg Lys Asn Ala Leu Ala

290 295 300

Ile Ala Ser Asp Ala Ala Ala Val Arg Ala Asp Ala Ala Ala Ala Ala

305 310 315 320

Ala Asp Asp Ala Ala Lys Ala Asn Asn Ala Ala Ser Arg Gly Ser Asp

325 330 335

Gly Leu Thr Ala Arg Ala Asn Ala Ala Thr Leu Ala Ser Asp Ala Ala

340 345 350

Arg Arg Ala Ser Asn Ala Ala Thr Ala Ala Ser Asp Ala Ala Thr Asp

355 360 365

Arg Leu Asn Ala Ala Thr Ala Ala Ser Asn Ala Ala Thr Ala Arg Ala

370 375 380

Asn Ala Ala Thr Arg Ala Asp Asp Ala Ala Thr Asp Ala Asp Asn Ala

385 390 395 400

Ala Ser Lys Ala Ser Asp Val Ser Ala Ile Glu Ala Asp Asn Ala Ala

405 410 415

Arg Ala Ala Asp Ala Asp Ala Ile Ala Thr Asn Arg Ala Ala Glu Ala

420 425 430

Ser Asp Ala Ala Ala Ile Ala Ala Asp Ala Ala Ala Asn Ala Ala Asp

435 440 445

Ala Ala Ala Gln Cys Asn Asn Lys Val Ala Arg Val Ser Asp Ala Leu

450 455 460

Ala Leu Ala Ala Asn Ala Ala Ala Arg Gly Ser Asp Ala Ala Ala Glu

465 470 475 480

Ala Gln Asp Ala Val Ala Arg Ala Ser Asp Ala Ala Ala Ala Gln Ala

485 490 495

Asp Gly Val Ala Ile Ala Val Asn Gly Ala Thr Ala Arg Asp Ser Ala

500 505 510

Ile Glu Ala Ala Ala Thr Ala Gly Ala Ala Gln Ala Lys Ala Ala Gly

515 520 525

Arg Ala Gly Ala Ala Ala Ala Gly Leu Arg Ala Gly Ala Ala Arg Gly

530 535 540

Ala Ala Ala Gly Ser Ala Arg Gly Leu Ala Gly Gly Leu Ala Ala Gly

545 550 555 560

Ser Asn Ala Gly Ile Ala Ala Gly Ala Ala Ser Gly Leu Ala Arg Gly

565 570 575

Ala Ala Ala Glu Val Cys Ala Ala Arg Ile Ala Leu

580 585

<210>74

<211>1689

<212>DNA

<213>玛草蛉(Mallada signata)

<400>74

gctgtattga tttctggttc ggctgctggt gcttcctcac acaatgctgc tggtgcagct 60

gcagcagcca gagctgcctt aggcgcttct ggggctgcag gtttaggtgc tgcatctggt 120

gctgcaagaa gaaacgtagc agttggtgct aacggtgccg ccgccgctag tgctgcagct 180

gcagctgcca gacgagctgg cgctattggc ctaaatggag cagctggagc taatgtagct 240

gtcgctggtg gcaaaaaagg aggtgctgct ggattaaatg ctggcgctgg tgcttcttta 300

gtatctgcag ctgcaagacg aaatggagcc cttggactta acggtgcagc tggagcaaat 360

ctcgcagcag ctggtggcaa aaaaggaggt gctattggat taaacgctgg agcatcagcc 420

aatgttggtg ccgctgctgc caagaaaaat ggagccatag gacttaactc agctgcttca 480

gctaatgctg ccgctgccgc tgctaaaaaa ggtggagcca ttggattgaa tgctggagct 540

tcagcaaatg ctgctgctgc cgctgccaag aagagtggag ctgttggatt aaatgctgga 600

gcttctgcta acgctgctgc tgctgctgcc aagaaaagtg gagctgttgc tgccaattcc 660

gctgcttcag caaatgcagc tgctgctgca caaaagaaag ccgctgctga tgccgcaaat 720

gctgctgctt ctgaaagtgc tgctgctgct gcagccaaga aagccgccgc tgttgctgaa 780

aatgcagctg ccaccgccaa tgccgcttca gctttacgta aaaatgcatt agccattgcc 840

agtgatgcag cagctgtccg tgctgatgcc gctgccgccg ccgctgacga tgctgctaaa 900

gctaacaacg ctgcttcccg tggaagtgat ggtttaactg cccgcgccaa tgccgccact 960

ttagccagtg atgctgcccg tagagctagc aatgcagcaa cagctgccag cgatgctgcc 1020

actgaccgat tgaacgccgc caccgctgct agcaacgctg ccactgctcg tgcaaatgcc 1080

gccacacgtg ccgatgatgc cgccactgat gccgacaatg ctgcttcaaa ggccagtgat 1140

gtatcagcta ttgaagccga caacgctgca cgagctgctg atgctgatgc tatcgctacc 1200

aaccgtgccg ctgaagcaag cgatgctgct gctattgccg ctgatgccgc tgccaatgct 1260

gctgatgccg ctgcccaatg taataacaaa gttgcccgag taagtgatgc cttagctctc 1320

gccgctaatg ctgctgcccg aggatctgat gccgccgctg aagctcaaga tgctgttgcc 1380

agagcaagtg acgctgccgc tgcccaagct gatggtgttg ccattgccgt aaatggagct 1440

actgcgagag actcagcaat tgaagccgct gctactgctg gagctgccca agctaaagcc 1500

gctggacgtg ctggagctgc tgcagctggt ttaagagctg gtgccgctag aggtgctgcc 1560

gctggtagtg cccgcggtct agctggagga ttagctgcag gttccaatgc tggaatcgcg 1620

gctggtgcag cttctggatt agcaagaggc gcagctgctg aagtttgcgc agctagaata 1680

gcattgtaa 1689

<210>75

<211>1767

<212>DNA

<213>玛草蛉(Mallada signata)

<400>75

atggcagcgt cgaacaaaat catcttcagc tttttagcta ttgttctatt acaacttgcc 60

acacactgtt catcaacagc tgtattgatt tctggttcgg ctgctggtgc ttcctcacac 120

aatgctgctg gtgcagctgc agcagccaga gctgccttag gcgcttctgg ggctgcaggt 180

ttaggtgctg catctggtgc tgcaagaaga aacgtagcag ttggtgctaa cggtgccgcc 240

gccgctagtg ctgcagctgc agctgccaga cgagctggcg ctattggcct aaatggagca 300

gctggagcta atgtagctgt cgctggtggc aaaaaaggag gtgctgctgg attaaatgct 360

ggcgctggtg cttctttagt atctgcagct gcaagacgaa atggagccct tggacttaac 420

ggtgcagctg gagcaaatct cgcagcagct ggtggcaaaa aaggaggtgc tattggatta 480

aacgctggag catcagccaa tgttggtgcc gctgctgcca agaaaaatgg agccatagga 540

cttaactcag ctgcttcagc taatgctgcc gctgccgctg ctaaaaaagg tggagccatt 600

ggattgaatg ctggagcttc agcaaatgct gctgctgccg ctgccaagaa gagtggagct 660

gttggattaa atgctggagc ttctgctaac gctgctgctg ctgctgccaa gaaaagtgga 720

gctgttgctg ccaattccgc tgcttcagca aatgcagctg ctgctgcaca aaagaaagcc 780

gctgctgatg ccgcaaatgc tgctgcttct gaaagtgctg ctgctgctgc agccaagaaa 840

gccgccgctg ttgctgaaaa tgcagctgcc accgccaatg ccgcttcagc tttacgtaaa 900

aatgcattag ccattgccag tgatgcagca gctgtccgtg ctgatgccgc tgccgccgcc 960

gctgacgatg ctgctaaagc taacaacgct gcttcccgtg gaagtgatgg tttaactgcc 1020

cgcgccaatg ccgccacttt agccagtgat gctgcccgta gagctagcaa tgcagcaaca 1080

gctgccagcg atgctgccac tgaccgattg aacgccgcca ccgctgctag caacgctgcc 1140

actgctcgtg caaatgccgc cacacgtgcc gatgatgccg ccactgatgc cgacaatgct 1200

gcttcaaagg ccagtgatgt atcagctatt gaagccgaca acgctgcacg agctgctgat 1260

gctgatgcta tcgctaccaa ccgtgccgct gaagcaagcg atgctgctgc tattgccgct 1320

gatgccgctg ccaatgctgc tgatgccgct gcccaatgta ataacaaagt tgcccgagta 1380

agtgatgcct tagctctcgc cgctaatgct gctgcccgag gatctgatgc cgccgctgaa 1440

gctcaagatg ctgttgccag agcaagtgac gctgccgctg cccaagctga tggtgttgcc 1500

attgccgtaa atggagctac tgcgagagac tcagcaattg aagccgctgc tactgctgga 1560

gctgcccaag ctaaagccgc tggacgtgct ggagctgctg cagctggttt aagagctggt 1620

gccgctagag gtgctgccgc tggtagtgcc cgcggtctag ctggaggatt agctgcaggt 1680

tccaatgctg gaatcgcggc tggtgcagct tctggattag caagaggcgc agctgctgaa 1740

gtttgcgcag ctagaatagc attgtaa 1767

<210>76

<211>975

<212>DNA

<213>人工序列

<220>

<223>为植物表达而进行优化的蜜蜂丝蛋白(Xenospira4)开放读码框(在亚克隆到pET14b和pVEC8之前)

<400>76

atggctagag aagaggttga gactagggat aagactaaga cttctactgt ggtgaagtct 60

gagaaggttg aagttgtggc tccagctaag gatgagctta agttgacttc tgagccaatt 120

ttcggaagaa gagtgggaac tggagcttct gaagtggctt cttctagtgg agaggctatt 180

gctatttctc ttggagctgg acaatcagca gcagagtctc aagctcttgc tgcttctcag 240

tctaagactg ctgctaacgc tgctattggt gcttctgagc ttactaacaa ggtggcagct 300

cttgttgctg gtgctactgg tgctcaagct agagctactg ctgcttcttc ttctgctctt 360

aaggcttctc ttgctactga agaggctgct gaagaagctg aagctgctgt tgcagatgct 420

aaagcagctg ctgagaaggc tgagtctctt gctaagaacc ttgcttctgc tagtgctaga 480

gctgctcttt cttctgagag ggctaatgag cttgctcagg ctgaaagtgc tgcagctgct 540

gaagctcaag ctaagaccgc tgctgctgcc aaagcagctg agattgctct taaggtggca 600

gagattgctg taaaagctga ggcagatgct gccgccgcag ccgtggcagc tgcaaaagct 660

agagctgtgg ctgatgcagc agccgccagg gctgctgctg ttaacgctat tgctaaggct 720

gaagaagagg cttcagctca agctgagaac gcagctggtg ttcttcaagc agctgcaagt 780

gctgctgctg agtcaagagc agcagcagcc gctgccgcag ctacttctga agcagcagct 840

gaagcaggac cacttgctgg tgaaatgaag ccaccacatt ggaagtggga gaggattcca 900

gtgaagaaag aagagtggaa aacttctaca aaagaggaat ggaaaactac taacgaagag 960

tgggaggtga agtga 975

<210>77

<211>324

<212>PRT

<213>人工序列

<220>

<223>为植物表达而进行优化的开放读码框编码的蜜蜂丝蛋白(Xenospira4)(无翻译融合)

<400>77

Met Ala Arg Glu Glu Val Glu Thr Arg Asp Lys Thr Lys Thr Ser Thr

1 5 10 15

Val Val Lys Ser Glu Lys Val Glu Val Val Ala Pro Ala Lys Asp Glu

20 25 30

Leu Lys Leu Thr Ser Glu Pro Ile Phe Gly Arg Arg Val Gly Thr Gly

35 40 45

Ala Ser Glu Val Ala Ser Ser Ser Gly Glu Ala Ile Ala Ile Ser Leu

50 55 60

Gly Ala Gly Gln Ser Ala Ala Glu Ser Gln Ala Leu Ala Ala Ser Gln

65 70 75 80

Ser Lys Thr Ala Ala Asn Ala Ala Ile Gly Ala Ser Glu Leu Thr Asn

85 90 95

Lys Val Ala Ala Leu Val Ala Gly Ala Thr Gly Ala Gln Ala Arg Ala

100 105 110

Thr Ala Ala Ser Ser Ser Ala Leu Lys Ala Ser Leu Ala Thr Glu Glu

115 120 125

Ala Ala Glu Glu Ala Glu Ala Ala Val Ala Asp Ala Lys Ala Ala Ala

130 135 140

Glu Lys Ala Glu Ser Leu Ala Lys Asn Leu Ala Ser Ala Ser Ala Arg

145 150 155 160

Ala Ala Leu Ser Ser Glu Arg Ala Asn Glu Leu Ala Gln Ala Glu Ser

165 170 175

Ala Ala Ala Ala Glu Ala Gln Ala Lys Thr Ala Ala Ala Ala Lys Ala

180 185 190

Ala Glu Ile Ala Leu Lys Val Ala Glu Ile Ala Val Lys Ala Glu Ala

195 200 205

Asp Ala Ala Ala Ala Ala Val Ala Ala Ala Lys Ala Arg Ala Val Ala

210 215 220

Asp Ala Ala Ala Ala Arg Ala Ala Ala Val Asn Ala Ile Ala Lys Ala

225 230 235 240

Glu Glu Glu Ala Ser Ala Gln Ala Glu Asn Ala Ala Gly Val Leu Gln

245 250 255

Ala Ala Ala Ser Ala Ala Ala Glu Ser Arg Ala Ala Ala Ala Ala Ala

260 265 270

Ala Ala Thr Ser Glu Ala Ala Ala Glu Ala Gly Pro Leu Ala Gly Glu

275 280 285

Met Lys Pro Pro His Trp Lys Trp Glu Arg Ile Pro Val Lys Lys Glu

290 295 300

Glu Trp Lys Thr Ser Thr Lys Glu Glu Trp Lys Thr Thr Asn Glu Glu

305 310 315 320

Trp Glu Val Lys

Claims

1、一种基本上纯化的和/或重组的丝多肽，其中至少该丝多肽的一部分具有卷曲螺旋结构。

2、根据权利要求1所述的多肽，其中具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg，并且其中至少25％的a和d位氨基酸是丙氨酸残基。

3、根据权利要求1所述的多肽，其中具有卷曲螺旋结构的该多肽部分包括至少10拷贝的七肽序列abcdefg，并且至少25％的a、d和e位氨基酸是丙氨酸残基。

4、根据权利要求1到3中任何一项所述的多肽，其包括选自下述的序列：

iii)i)或ii)的生物活性片段。

5、根据权利要求1到3中任何一项所述的多肽，其包括选自下述的序列：

iii)i)或ii)的生物活性片段。

6、根据权利要求1到3中任何一项所述的多肽，其包括选自下述的序列：

iii)i)或ii)的生物活性片段。

7、根据权利要求1到3中任何一项所述的多肽，其包括选自下述的序列：

iii)i)或ii)的生物活性片段。

8、根据权利要求1到3中任何一项所述的多肽，其包括选自下述的序列：

i)SEQ ID NO：72或SEQ ID NO：73所提供的氨基酸序列；

iii)i)或ii)的生物活性片段。

9、一种基本上纯化的和/或重组的丝多肽，其包括选自下述的序列：

iii)i)或ii)的生物活性片段。

10、根据权利要求1到9中任何一项所述的多肽，其可从膜翅目昆虫或脉翅目昆虫的一个物种中纯化获得。

11、根据权利要求10所述的多肽，其中所述的膜翅目昆虫的物种为意大利蜂Apis mellifera、黄猄蚁Oecophylla smaragdina、牛头犬蚁Myrmecia foricata或授粉熊蜂Bombus terrestris。

12、根据权利要求10所述的多肽，其中所述的脉翅目昆虫的物种为玛草蛉Mallada signata。

13、根据权利要求1到12中任何一项所述的多肽，其与至少一种其他多肽融合。

14、一种编码丝多肽的分离的和/或外源多核苷酸，其中至少丝多肽的一部分具有卷曲螺旋结构。

15、根据权利要求14所述的多核苷酸，其中该多核苷酸包括选自下述的序列：

ii)编码如权利要求1到4或10到13中任何一项所述的多肽的核苷酸序列，

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

16、根据权利要求14所述的多核苷酸，其中该多核苷酸包括选自下述的序列：

ii)编码如权利要求1到3、5或10到13中任何一项所述的多肽的核苷酸序列，

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

17、根据权利要求14所述的多核苷酸，其中该多核苷酸包括选自下述的序列：

ii)编码如权利要求1到3、6或10到13中任何一项所述的多肽的核苷酸序列，

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

18、根据权利要求14所述的多核苷酸，其中该多核苷酸包括选自下述的序列：

ii)编码如权利要求1到3、7或10到13中任何一项所述的多肽的核苷酸序列，

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

19、根据权利要求14所述的多核苷酸，其中该多核苷酸包括选自下述的序列：

i)SEQ ID NO：74或SEQ ID NO：75所提供的核苷酸序列；

ii)编码如权利要求1到3、8或10到13中任何一项所述的多肽的核苷酸序列，

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

20、一种分离的和/或外源多核苷酸，该多核苷酸包括选自下述的序列：

ii)编码如权利要求1到3或9到13中任何一项所述的多肽的核苷酸序列，

iv)在严谨条件下可与i)到iii)中任何一条杂交的序列。

21、包括至少一种如权利要求14到20中任何一项所述的多核苷酸的载体。

22、根据权利要求21所述的载体为表达载体。

23、包括至少一种如权利要求14到20中任何一项所述的多核苷酸，和/或至少一种如权利要求21或22所述的载体的宿主细胞。

24、根据权利要求23所述的宿主细胞是细菌、酵母或植物细胞。

25、制备如权利要求1到13中任何一项所述的多肽的方法，该方法包括在允许编码所述多肽的多核苷酸表达的条件下，培养如权利要求23或24所述的宿主细胞，或者如权利要求22所述的载体，以及回收所表达的多肽。

26、包括外源多核苷酸，编码至少一种如权利要求1到13中任何一项所述的多肽的多核苷酸的转基因植物。

27、包括外源多核苷酸，编码至少一种如权利要求1到13中任何一项所述的多肽的非人类转基因动物。

28、特异性结合如权利要求1到12中任何一项所述的多肽的抗体。

29、包括至少一种如权利要求1到13中任何一项所述的多肽的丝纤维。

30、根据权利要求29所述的丝纤维，其中至少一些所述的多肽是交联的。

31、根据权利要求30所述的丝纤维，其中至少所述的多肽的一些赖氨酸残基是交联的。

32、包括至少两种如权利要求1到13中任何一项所述的多肽的共聚物。

33、根据权利要求32所述的共聚物，其包括如权利要求4所述的多肽，如权利要求5所述的多肽，如权利要求6所述的多肽，以及如权利要求7所述的多肽。

34、根据权利要求33所述的共聚物，其进一步包括如权利要求9所述的多肽。

35、根据权利要求33或34所述的共聚物，其中至少一些所述的多肽是交联的。

36、根据权利要求35所述的共聚物，其中至少所述的多肽的一些赖氨酸残基是交联的。

37、包括至少一种如权利要求1到13中任何一项所述的多肽，如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物的产品。

38、根据权利要求37所述的产品，其中该产品选自个人护理产品、纺织品、塑料制品或生物医学产品组成的群组。

39、包括至少一种如权利要求1到13中任何一项所述的多肽，如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物，以及一种或一种以上可接受的载体的组合物。

40、根据权利要求39所述组合物进一步包括药物。

41、用作药物、或者在医疗器械或化妆品中使用的如权利要求39所述组合物。

42、包括至少一种如权利要求14到20任何一项所述的多核苷酸，以及一种或一种以上可接受的载体的组合物。

43、一种治疗或预防疾病的方法，该方法包括给予包括治疗或预防该疾病的药物和药用载体的组合物，其中所述的药用载体选自至少一种如权利要求1到13中任何一项所述的多肽，如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物。

44、至少一种如权利要求1到13中任何一项所述的多肽，如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物，以及药物，在制备治疗或预防疾病的药物中的用途。

45、包括至少一种如权利要求1到13中任何一项所述的多肽，至少一种如权利要求14到20任何一项所述的多核苷酸，至少一种如权利要求21或22所述的载体，至少一种如权利要求29到31中任何一项所述的丝纤维和/或如权利要求32到36任何一项所述的共聚物的试剂盒。