DE69736215T2 - Verfahren zur Detektion von Zielnukleinsäuren unter Verwendung von Markernukleinsäuren - Google Patents

Verfahren zur Detektion von Zielnukleinsäuren unter Verwendung von Markernukleinsäuren Download PDF

Info

Publication number
DE69736215T2
DE69736215T2 DE69736215T DE69736215T DE69736215T2 DE 69736215 T2 DE69736215 T2 DE 69736215T2 DE 69736215 T DE69736215 T DE 69736215T DE 69736215 T DE69736215 T DE 69736215T DE 69736215 T2 DE69736215 T2 DE 69736215T2
Authority
DE
Germany
Prior art keywords
tags
array
nucleic acid
hybridization
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Revoked
Application number
DE69736215T
Other languages
English (en)
Other versions
DE69736215D1 (de
Inventor
Macdonald S. Felton Morris
Daniel D. Stanford Schoemaker
Ronald W. Palo Alto Davis
Michael P. Palo Alto Mittmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affymetrix Inc
Original Assignee
Affymetrix Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=24509751&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69736215(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Affymetrix Inc filed Critical Affymetrix Inc
Application granted granted Critical
Publication of DE69736215D1 publication Critical patent/DE69736215D1/de
Publication of DE69736215T2 publication Critical patent/DE69736215T2/de
Anticipated expiration legal-status Critical
Revoked legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J19/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J19/0046Sequential or parallel reactions, e.g. for the synthesis of polypeptides or polynucleotides; Apparatus and devices for combinatorial chemistry or for making molecular arrays
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00527Sheets
    • B01J2219/00529DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • B01J2219/00542Alphanumeric characters
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00608DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/0061The surface being organic
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00612Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports the surface being inorganic
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00614Delimitation of the attachment areas
    • B01J2219/00621Delimitation of the attachment areas by physical means, e.g. trenches, raised areas
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00623Immobilisation or binding
    • B01J2219/00626Covalent
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00632Introduction of reactive groups to the surface
    • B01J2219/00637Introduction of reactive groups to the surface by coating it with another layer
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00639Making arrays on substantially continuous surfaces the compounds being trapped in or bound to a porous medium
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00659Two-dimensional arrays
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/00695Synthesis control routines, e.g. using computer programs
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/00702Processes involving means for analysing and characterising the products
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00722Nucleotides
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes

Description

  • GEBIET DER ERFINDUNG
  • Die vorliegende Offenbarung bezieht sich auf Sätze von Nukleinsäuretags, Oligonukleotidsondenarrays, mit Nukleinsäuretags versehene Sätze von rekombinanten Zellen und andere Zusammensetzungen und Verfahren zur Selektionierung von Oligonukleotidsondenarrays. Die Offenbarung betrifft die Selektionierung und Interaktion von Nukleinsäuren und auf festen Substraten immobilisierten Nukleinsäuren, einschließlich der damit in Verbindung stehenden chemischen, biologischen und medizindiagnostischen Verwendungen.
  • HINTERGRUND DER ERFINDUNG
  • Verfahren zur Herstellung großer Arrays aus Oligonukleotiden und anderen Polymeren auf einem festen Substrat sind bekannt. Pirrung et al., U.S. Patent Nr. 5,143,854 (siehe auch PCT-Anmeldung Nr. WO 90/15070), McGall et al., U.S. Patent Nr. 5,412,087, Chee et al. SN PCT/US94/12305 und Fodor et al., PCT-Veröffentlichung Nr. WO 92/10092 beschreiben Verfahren zur Herstellung von Arrays aus Oligonukleotiden und anderen Polymeren unter Verwendung von z. B. lichtgesteuerten Synthesetechniken.
  • In der Veröffentlichung von Fodor et al. werden Verfahren zur Verwendung von computergesteuerten Systemen zur Steuerung der Polymerarraysynthese beschrieben. Unter Verwendung des Ansatzes von Fodor wird ein heterogenes Array aus Polymeren durch gleichzeitige Kopplung an multiplen Reaktionsstellen in ein anderes heterogenes Array umgewandelt. Siehe auch Fodor et al. (1991) Science, 251: 767-777; Lipshutz et al. (1995) BioTechniques 19(3): 442-447; Fodor et al. (1993) Nature 364: 555-556 und Medlin (1995) Environmental Health Perspectives 244-246. Die Arrays werden typischerweise auf einer festen Oberfläche mit einer Fläche von weniger als 1 inch2 platziert, wenngleich optional auch wesentlich größere Oberflächen verwendet werden.
  • Weitere zur Polymersynthese auf einem Substrat anwendbare Verfahren sind z. B. beschrieben in U.S. Patent Nr. 5,384,261, welches hierin durch Bezugnahme für alle Zwecke einbezogen ist. In den in diesen Anmeldungen offenbarten Verfahren werden Reagenzien an das Substrat herangebracht, indem Polymersynthesereagenzien auf vorbestimmte Bereiche des festen Substrats fließen gelassen oder aufgespritzt werden. In jedem Fall werden bestimmte aktivierte Bereiche des Substrats physikalisch von anderen Bereichen abgetrennt, wenn die Monomerlösungen an die verschiedenen Reaktionsstellen gebracht werden, z. B. mittels Rillen, Wells und dergleichen.
  • Verfahren zur Synthese von Polymerarrays werden hierin als VLSIPSTM ("very large scale immobilized polymer synthesis")-Verfahren bezeichnet. Oligonukleotid-VLSIPSTM-Arrays sind z. B. zweckmäßig bei einer Vielzahl von Verfahren zur Überwachung von Testnukleinsäuren in einer Probe. In Sondenarrays mit multiplen Sondensätzen können viele individuelle Hybridisierungsinteraktionen gleichzeitig überwacht werden. Jedoch kann eine unerwünschte Hybridisierung zwischen Sonden oder zwischen Sonden und anderen Nukleinsäuren die Analyse von multiplen Hybridisierungen problematisch machen. Die vorliegende Erfindung löst diese und andere Probleme.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Mit der vorliegenden Erfindung ist es nunmehr möglich, viele individuelle Komponenten, die unter anderem in molekularen, zellulären oder viralen Bibliotheken vorliegen, unter Verwendung einer begrenzten Anzahl von Hybridisierungsbedingungen zu markieren und zu detektieren. Die Komponenten werden mit speziell ausgewählten Nukleinsäuretags markiert und die Anwesenheit von individuellen Tags wird durch die Hybridisierung an ein Sondenarray (typischerweise ein VLSIPSTM-Array aus Oligonukleotidsonden) überwacht. Folglich sind die Nukleinsäuretags Markierungen für die individuellen Komponenten und das Sondenarray stellt einen Markierungsleser bereit, welcher die gleichzeitige Detektion einer großen Anzahl von Nukleinsäuretags gestattet. Dies ermöglicht eine breit angelegte parallele Analyse aller Komponenten einer Mischung in einem einzigen Assay.
  • So können z. B., wie hierin erläutert, alle Mitglieder einer zellulären Bibliothek unter Verwendung einer Mischung aller Mitglieder der zellulären Bibliothek hinsichtlich der Antwort auf einen Umgebungsreiz in einem einzigen Assay getestet werden. Dies wird z. B. dadurch erreicht, dass jedes Mitglied der zellulären Bibliothek markiert wird, z. B. durch Klonieren eines Nukleinsäuretags in jeden Zelltyp in der Bibliothek, jeder Zelltyp in der Bibliothek in einer geeigneten Lösung vermischt wird und ein Teil dieser Lösung dem ausgewählten Umgebungsreiz ausgesetzt wird. Die Verteilung von Nukleinsäuren in der Bibliothek vor und nach dem Umgebungsreiz wird durch Hybridisierung der Nukleinsäuren an ein VLSIPSTM-Array verglichen, was die Detektion der Zellen gestattet, welche spezifisch von dem Umgebungsreiz betroffen sind.
  • Dem entsprechend stellt die vorliegende Offenbarung unter anderem bereit: Nukleinsäuretags, Sätze von Nukleinsäuretags, Verfahren zur Selektionierung von Nukleinsäuretags, Bibliotheken von Zellen, Viren oder dergleichen enthaltend Nukleinsäuretags, Arrays aus Oligonukleotidsonden, Arrays aus VLSIPSTM-Sonden, Verfahren zur Selektionierung von Arrays aus Oligonukleotidsonden, Verfahren zur Detektion von Nukleinsäuretags mit VLSIPSTM-Arrays und andere Merkmale, welche beim weiteren Lesen deutlich werden.
  • In einer Kategorie von Ausführungsformen stellt die vorliegende Offenbarung ein Verfahren zur Selektionierung eines Satzes von Nukleinsäuretags bereit, welche zur minimalen Kreuzhybridisierung an ein VLSIPSTM-Array bestimmt sind. Die Abwesenheit der Kreuzhybridisierung ermöglicht die Analyse von Hybridisierungsmustern an VLSIPSTM-Arrays, da sie Mehrdeutigkeiten in der Interpretation von Hybridisierungsergebnissen reduziert, welche auftreten, weil multiple Nukleinsäurespezies an eine einzelne Sondenspezies auf dem VLSIPSTM-Array binden. Folglich werden in den Selektionierungsverfahren der vorliegenden Offenbarung potentielle Tags aus dem Satz von Tags ausgeschlossen, sofern sie unter stringenten Bedingungen an die gleiche Nukleinsäure binden wie ausgewählte Tags. Typischerweise schließen die Selektionierungsverfahren die folgenden Schritte ein: Auswahl einer spezifischen thermischen Bindungsstabilität für die Säuretags gegen komplementäre Sonden und Ausschluss von Tags, welche selbstkomplementäre Regionen enthalten. Oftmals wird die thermische Bindungsstabilität der Tags ausgewählt, indem die Bindungsstabilität beeinflussende Parameter angegeben werden, ebenso wie die Länge und die Basenzusammensetzung (z. B. durch Auswahl von Tags mit dem gleichen Nukleotidverhältnis von AT zu GC) für die Nukleinsäuretags ausgewählt wird. In dieser Hinsicht benötigen Tags, welche bei der Bindung an eine komplementäre Sonde mehr GC-Bindungen bilden, weniger Basen insgesamt, um die gleiche Bindungsstabilität mit einer komplementären Sonde zu erreichen, wie Tags mit weniger GC-Resten. Die Bindungsstabilität wird auch von Basen stapelnden Interaktionen, der Bildung von Sekundärstrukturen und der Auswahl des Lösungsmittels, in welchem ein Tag an eine Sonde gebunden ist, beeinflusst.
  • Die Größe der Tags kann beträchtlich variieren, typischerweise beträgt ihre Länge jedoch zwischen etwa 8–150 Nukleotiden, noch typischer zwischen 10 und 100 Nukleotiden, oftmals etwa zwischen 15 und 30 Nukleotiden, im allgemeinen zwischen etwa 15 und 25 Nukleotiden und, in einer bevorzugten Ausführungsform, etwa 20 Nukleotide. In einigen Anwendungen sind die Tags beträchtlich länger als die Sonden, an welche sie hybridisieren. Die Verwendung von längeren Tags erhöht die Anzahl der Tags, aus denen nicht kreuzhybridisierende Sonden ausgewählt werden können.
  • Optional werden die Nukleinsäuretags so ausgewählt, dass sie konstante und variable Regionen aufweisen, was die Eliminierung einer aus der Eigenkomplementarität entstehenden Sekundärstruktur ermöglicht und strukturelle Eigenschaften zur Klonierung und Amplifikation der Tags bereitstellt. Beispielsweise werden gegebenenfalls PCR-Bindungsstellen oder Restriktionsenzymstellen in konstante Regionen der Tags eingebaut. In anderen Ausführungsformen werden gemäß codierungstheoretischer Verfahren kurze konstante Regionen hinzugefügt, um eine Fehlausrichtung der Tags zu vermeiden. Optional werden konstante Regionen während der Prozessierungsschritte von dem Tag abgetrennt, z. B. durch Spaltung der Nukleinsäuretags mit Klasse II-Restriktionsenzymen.
  • Oftmals ist es wünschenswert, Tags zu eliminieren, welche Serien von 4 Nukleotiden ausgewählt aus der Gruppe bestehend aus 4 X-Resten, 4 Y-Resten und 4 Z-Resten, wobei X ausgewählt ist aus der Gruppe bestehend aus G und C, Y ausgewählt ist aus der Gruppe bestehend aus G und A und Z ausgewählt ist aus der Gruppe bestehend aus A und T. Die Eliminierung von solche Serien von Nukleotiden enthaltenden Tags aus einem Satz von Tags vermindert die Bildung von Sekundärstruktur in den ausgewählten Tags in dem Satz von Tags. In manchen Ausführungsformen sind bestimmte Serien gestattet, während andere ausgeschlossen werden. Beispielsweise sind in einer Ausführungsform Serien von 4 A/T- oder G/C-Nukleotiden unzulässig.
  • In vielen Ausführungsformen sind Tags ausgeschlossen, die sich um weniger als etwa 80% der Gesamtzahl an Nukleotiden, welche die Tags umfassen, unterscheiden. Beispielsweise unterscheiden sich vorzugsweise alle ausgewählten Tags in einem ausgewählten Satz von Tags um mindestens etwa 4–5 Nukleotide. Es ist ebenfalls wünschenswert, Tags auszuschließen, welche umfangreiche Regionen der Sequenzidentität gemeinsam haben, da die identischen Regionen an Nukleinsäuren kreuzhybridisieren können, die eine zur identischen Region komplementäre Untersequenz aufweisen. Beispielsweise werden 20-mer-Tags typischerweise ausgeschlossen, sofern sie über Regionen von 9 oder mehr Nukleotiden identisch sind.
  • Die Tags in den Tagsätzen der vorliegenden Erfindung unterscheiden sich typischerweise um mindestens zwei Nukleotide, und vorzugsweise um 3–5 Nukleotide für ein typisches 20-mer. Eine Liste von Tags, welche sich um mindestens zwei Nukleotide unterscheiden, kann durch paarweisen Vergleich eines jeden Tags oder durch andere Verfahren erstellt werden. Beispielsweise können die Tagsequenzen für maximale Korrespondenz ausgerichtet und Tags mit einer einzelnen Fehlpaarung verworfen werden. In einer Kategorie von Ausführungsformen wird die Anzahl von A + G-Nukleotiden in jeder der variablen Regionen eines jeden Tags so ausgewählt, dass sie gerade (oder alternativ ungerade) ist. So wird eine "Paritätsbase" oder "Error-Korrekturbase" bereitgestellt, welche sicherstellt, dass jedes Tag mindestens zwei Hybridisierungsfehlpaarungen zwischen jedem Tag in dem Satz von Tags und jeder einzelnen komplementären Nukleinsäuresonde (außer der Sonde, die ein perfektes Komplement zu dem Tag ist) aufweist. Andere Verfahren zur Sicherstellung, dass mindestens zwei Fehlpaarungen zwischen jedem Tag in einem Satz von Tags und jeder einzelnen Hybridisierungssonde existieren, sind ebenfalls geeignet.
  • Im Allgemeinen ermöglicht die Auswahl der Nukleinsäuretags die Auswahl der Nukleinsäuresonden, z. B. auf VLSIPSTM-Arrays, welche zur Überwachung der Nukleinsäuretags durch Hybridisierung verwendet werden. Genauer gesagt werden die Sonden auf dem Array hinsichtlich ihrer Fähigkeit ausgewählt, an variable Sequenzen in dem Satz von Nukleinsäuretags zu hybridisieren (die "variable" Region eines Tags, welches keine konstante Region einschließt, ist das gesamte Tag). Folglich können alle Regeln zur Auswahl von Nukleinsäuretags auf die Auswahl von Nukleinsäuresonden angewandt werden, z. B. mittels Durchführung der Schritte zur Tagauswahl und nachfolgender Bestimmung des komplementären Satzes von Nukleinsäuresonden.
  • In einer weiteren Kategorie von Ausführungsformen stellt die vorliegende Offenbarung Zusammensetzungen umfassend Sätze von Nukleinsäuretags einschließend eine Vielzahl von Nukleinsäuretags bereit. In bevorzugten Ausführungsformen umfasst der Satz von Nukleinsäuretags von 100 bis 100.000 Tags. Typischerweise wird ein Satz von Tags zwischen etwa 500 und 15.000 Tags einschließen. Üblicherweise liegt die Anzahl von Tags in einem Satz von Tags zwischen etwa 5.000 und etwa 14.000 Tags. In einer bevorzugten Ausführungsform umfasst ein Satz von Tags gemäß der vorliegenden Erfindung etwa 8.000 bis 9.000 Tags. Die Tagsequenzen umfassen typischerweise eine variable Region, wobei die variable Region eines jeden Nukleinsäuretags in dem Satz von Nukleinsäuretags das gleiche Verhältnis von G + C zu A + T, in etwa die gleiche Tm und die gleiche Länge aufweist und nicht an eine einzelne komplementäre Nukleinsäuresonde kreuzhybridisiert. Im typischsten Fall können die Nukleinsäuretags in dem Satz von Nukleinsäuretags nicht mit weniger als zwei Unterschieden zwischen jedem Paar von Nukleinsäuretags in dem Satz von Nukleinsäuretags ausgerichtet werden, und oftmals existieren mindestens 5 Unterschiede zwischen jedem Paar von Tags in einem Satz von Tags. In einer Ausführungsform umfassen die Tags ebenfalls eine konstante Region, so wie eine PCR-Primerbindungsstelle zur Amplifikation des Tags.
  • In einer Kategorie von Ausführungsformen stellt die vorliegende Offenbarung ein Verfahren zur Markierung einer Zusammensetzung bereit, umfassend die Assoziierung eines Nukleinsäuretags mit der Zusammensetzung, wobei das Nukleinsäuretag ausgewählt ist aus einer Gruppe von Nukleinsäuretags, welche nicht kreuzhybridisieren und welche eine im wesentlichen ähnliche Tm aufweisen. Typischerweise werden die Tagmarkierungen mit einem VLSIPSTM-Array detektiert, welches zu den für die Markierung der Zusammensetzung verwendeten Tags komplementäre Sonden umfasst.
  • Wie hierin beschrieben, schließen bevorzugte Zusammensetzungen Bestandteile zellulärer, viraler oder molekularer Bibliotheken ein, so wie rekombinante Zellen, rekombinante Viren oder Polymere. Der Fachmann wird jedoch leicht erkennen, dass auch andere Zusammensetzungen unter Verwendung der Nukleinsäuretags markiert werden können und dass die Tags unter Verwendung von VLSIPSTM-Arrays detektiert werden können. Beispielsweise können Geldscheine von beträchtlichem Wert mit einem Satz von Nukleinsäuretags markiert werden und Fälschungen können durch Überwachung der Hybridisierung beim Waschen der Scheine (oder z. B. bei einer PCR-Amplifikation von angefügten Nukleinsäuren, welche Tagsequenzen kodieren) mit einem geeigneten VLSIPSTM-Array detektiert werden.
  • In einer weiteren Kategorie von Ausführungsformen stellt die vorliegende Offenbarung Verfahren zur Vorauswahl von experimentellen Sonden in einem Oligonukleotidsondenarray bereit, wobei die Sonden im Wesentlichen einheitliche Hybridisierungseigenschaften aufweisen und nicht an ein Zielnukleinsäuretag kreuzhybridisieren. In diesen Verfahren wird ein den experimentellen Sonden in dem Array gemeinsames Verhältnis von G + C- zu A + T-Nukleotiden ausgewählt und alle in Frage kommenden 4-Nukleotid-Untersequenzen für die Sonden auf dem Array werden bestimmt. Alle potentiellen Sonden des Arrays, welche unzulässige 4-Nukleotid-Untersequenzen enthalten, werden von den experimentellen Sonden des Arrays ausgeschlossen. 4-Nukleotid-Untersequenzen sind dann unzulässig, wenn die Nukleotid-Untersequenzen ausgewählt sind aus der Gruppe bestehend aus selbstkomplementären Sonden, A4-Sonden, T4-Sonden und [G, C]4-Sonden. Auch im Falle, dass das Zielnukleinsäuretag eine konstante Region umfasst, sind alle Sonden, welche zu der Untersequenz der konstanten Region des Zielnukleinsäuretags komplementär sind, unzulässig und sind nicht Bestandteil des Satz von Tags. Typischerweise wird eine Länge für die Sonden des Arrays ausgewählt, wenngleich nicht hybridisierende Abschnitte der Sonde (d.h. Nukleotide, welche nicht an eine Zielnukleinsäure hybridisieren) gegebenenfalls zwischen verschiedenen Klassen von Sonden variieren. "Experimentelle Sonden" hybridisieren an ein Zielnukleinsäuretag, während "Kontrollsonden" entweder nicht an ein Zielnukleinsäuretag binden oder an eine Nukleinsäure binden, welche Hybridisierungseigenschaften aufweist, die sich von denen der Zielnukleinsäuretags in einem Satz von Nukleinsäuretags unterscheiden. Beispielsweise werden Kontrollsonden gegebenenfalls in VLSIPSTM-Arrays verwendet, um die Hybridisierungsstringenz gegen eine bekannte Nukleinsäure zu überprüfen.
  • In einer Kategorie von Verfahren der vorliegenden Erfindung, welche in Anspruch 2 spezifiziert ist, wird eine Vielzahl von Testnukleinsäuren gleichzeitig in einer Probe detektiert. In diesen Verfahren wird ein Array von experimentellen Sonden, welche unter stringenten Bedingungen nicht an ein Target kreuzhybridisieren, verwendet, um die Zielnukleinsäuren zu detektieren. Typischerweise ist das Verhältnis von G + C-Basen in jeder experimentellen Sonde im Wesentlichen identisch. Die Sonden des Arrays werden in Sondensätzen angeordnet, wobei jeder Sondensatz eine homogene Population von Oligonukleotidsonden umfasst. Beispielsweise werden viele einzelne Sonden mit der gleichen Nukleotidsequenz zueinander benachbart in einem bestimmten geometrischen Muster auf der Oberfläche eines Arrays angeordnet. Sondensätze werden zueinander benachbart zu einem Sondenarray angeordnet. Beispielsweise werden, falls es sich bei dem Sondenarray um ein VLSIPSTM-Array handelt, die Sondensätze gegebenenfalls in Quadraten auf der Oberfläche eines Substrats angeordnet, wodurch auf dem Substrat ein Schachbrettmuster aus Sondensätzen gebildet wird.
  • Unter stringenten Hybridisierungsbedingungen hybridisieren die Sonden des Arrays spezifisch an mindestens eine Testnukleinsäure in der Probe. Das Verfahren umfasst des Weiteren die Detektion der Hybridisierung der Testnukleinsäuren an das Array aus Oligonukleotidsonden. Typischerweise umfassen die Testnukleinsäuren Tagsequenzen, welche an die experimentellen Sonden des Arrays binden.
  • In einer Kategorie von Ausführungsformen stellt die vorliegende Offenbarung ein Array aus Oligonukleotidsonden bereit umfassend eine Vielzahl von auf einem festen Substrat befestigten experimentellen Oligonukleotidsondensätzen, wobei unter stringenten Hybridisierungsbedingungen jeder experimentelle Oligonukleotidsondensatz in dem Array an eine andere Zielnukleinsäure hybridisiert. Jede experimentelle Oligonukleotidsonde in den Sondensätzen des Arrays umfasst eine konstante Region und eine variable Region. Die variable Region kreuzhybridisiert unter stringenten Hybridisierungsbedingungen nicht mit der konstanten Region, und die Nukleinsäuresonden kreuzhybridisieren nicht an Zielnukleinsäuren. Typischerweise unterscheiden sich die Sonden aus jedem Sondensatz von den Sonden eines jeden anderen Sondensatzes in dem Array hinsichtlich der Anordnung von mindestens zwei Nukleotiden in den Sonden des Sondensatzes. Im allgemeinen ist das Verhältnis von G + C-Basen in jeder Sonde für jeden experimentellen Sondensatz im Wesentlichen identisch (was bedeutet, dass das G + C-Verhältnis um nicht mehr als 5% variiert), was gewährleistet, dass sie unter ähnlichen Hybridisierungsbedingungen an ein Target mit ähnlicher Reaktionsfreudigkeit hybridisieren. Gegebenenfalls umfassen die Arrays Kontrollsonden, z. B. um die Hybridisierungsbedingungen durch Überwachung der Bindung einer bekannten quantifizierten Nukleinsäure an die Kontrollsonde zu bewerten.
  • Die vorliegende Offenbarung stellt Arrays aus auf festen Substraten befestigten Oligonukleotiden bereit. Typischerweise werden die Oligonukleotidsonden in dem Array an definierten Stellen in dem Array in Sondensätzen angeordnet, um die Signalprozessierung der Hybridisierungsreaktionen zwischen den Oligonukleotidsonden und den Testnukleinsäuren in einer Probe zu verstärken. Die Oligonukleotidarrays können praktisch jede Anzahl an verschiedenen Oligonukleotidsätzen aufweisen, größtenteils bestimmt durch die Anzahl oder Vielfalt der Testnukleinsäuren oder Nukleinsäuretags, welche in einer gegebenen Anwendung gegen das Array gescreent werden sollen. In einer Kategorie von Ausführungsformen weist das Array von 10 bis zu 100 Oligonukleotidsätze auf. In weiteren Kategorien von Ausführungsformen weisen die Arrays zwischen 100 und 100.000 Sätze auf. In bestimmten Ausführungsformen weisen die Arrays zwischen 10.000 und 100.000 Sätze auf und in wiederum weiteren Ausführungsformen weisen die Arrays zwischen 100.000 und 1.000.000 Sätze auf. Am meisten bevorzugte Ausführungsformen werden zwischen 7.500 und 12.500 Sätze aufweisen. Beispielsweise werden die Arrays in einer bevorzugten Ausführungsform etwa 8.000 Sätze von Oligonukleotidsonden umfassen. In bevorzugten Ausführungsformen wird das Array eine Dichte von mehr als 100 Sätzen von Oligonukleotiden an bekannten Stellen pro cm2 aufweisen, oder noch bevorzugter mehr als 1.000 Sätze pro cm2. In manchen Ausführungsformen weisen die Arrays eine Dichte von mehr als 10.000 Sätzen pro cm2 auf.
  • Die vorliegende Erfindung stellt ebenfalls Kits wie in Anspruch 1 spezifiziert bereit. Kits der vorliegenden Erfindung umfassen jegliches Array und einen Satz von Tags. Da die Verfahren zur Verwendung der Arrays und Tags gegebenenfalls PCR, LCR und andere in vitro-Amplifikationstechniken zur Amplifikation von Nukleinsäuretags einschließen, schließen die Kits der vorliegenden Erfindung gegebenenfalls auch Reagenzien zur Durchführung von in vitro-Amplifikationsverfahren, so wie taq-Polymerase, Nukleotide, Computersoftware mit Programmen zur Selektionierung von Tags und dergleichen ein. Die Kits umfassen gegebenenfalls auch Reagenzien zur Markierung von Nukleinsäuren, Anleitungen, Behälter und andere Gegenstände, die für den Fachmann beim weiteren Lesen offensichtlich sein werden.
  • Die Erfindung wird durch die angehängten Ansprüche definiert.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist eine gescannte Darstellung eines 1,28 cm auf 1,28 cm Arrays mit hoher Dichte, das mit einem fluoreszenzmarkierten Kontrolloligonukleotid hybridisiert ist. Das Array enthält Sequenzen, welche komplementär zu 4.500 wie in Tabelle 1 beschrieben ausgewählten 20-mer-Tags sind. Die Kontrolloligonukleotide werden in den Ecken und in einem Fadenkreuzmuster über das Array synthetisiert, um die Einheitlichkeit der Synthese und der Hybridisierungsbedingungen zu verifizieren. Die Kontrolloligonukleotide wurden ebenfalls mit "DNA TAGS" beschriftet. Die dunklen Bereiche zeigen die Lage der 4.500 20-Basen-Molekulartags an. Es ist zu beachten, dass keine Kreuzhybridisierung der Kontrolloligonukleotide und der molekularen Tagsequenzen stattfindet.
  • 2 zeigt eine PCR-Targetingstrategie, welche verwendet wird, um mit Tags versehene Deletionsstränge zu erzeugen. (a) Der ORF (open reading frame) wird anhand der Sequenzinformation aus der Datenbank identifiziert. Regionen, die den ORF unmittelbar flankieren werden verwendet, um den Deletionsstrang zu erzeugen. (b) Der selektierbare Marker (kanr) wird unter Verwendung eines Paares von langen Primern amplifiziert, um ein ORF-spezifisches Deletionskonstrukt zu erzeugen. Der stromaufwärts gelegene 86-mer-Primer besteht aus (5' bis 3'): 30 Hefe-Homologie-Basen, einer gemeinsamen 18-Basen-Tag- Primingstelle, einem 20-Basen molekularen Tag und einer Sequenz von 22 Basen, welche zu einer Seite des Markers homolog ist. Das stromabwärts gelegene Oligonukleotid besteht aus 50 Basen von Hefehomologie zur anderen Seite des anvisierten ORF und 16 Basen, welche homolog zur anderen Seite des Markers sind. Die gestrichelte Linie, welche die langen Oligonukleotide repräsentiert, zeigt, dass die Primer ungereinigt sind und dass an ihrem 5'-Ende eine Sequenz fehlt. (c) Ein zweiter PCR-Durchgang mit 20-meren, welche zu den Enden des ursprünglichen PCR-Produkts homolog waren, wurde verwendet, um die zerfetzten Enden, welche von ungereinigtem Oligonukleotid im ersten Durchgang verursacht wurden, "wegzuspülen". (d) Der auf beiden Seiten von Hefe-ORF-Homologie flankierte resultierende Marker wird direkt in haploiden Hefestrang transformiert und eine homologe Rekombination führt zu einer Ersetzung des anvisierten ORF durch den Marker, das 20-mer-Tag und die Tag-Primingstelle.
  • 3 zeigt Oligonukleotide, welche verwendet werden, um den mit einem ADE1-Tag versehenen Deletionsstrang zu erzeugen. Ähnliche Sätze von Oligonukleotiden wurden für die anderen zehn auxotrophen ORFs synthetisiert.
  • 4 zeigt die Transformationsergebnisse und die Taginformation für elf auxotrophe ORFs. Mittels Replika-Plattierung und PCR wurden acht Kolonien aus jeder Transformation analysiert. Die daraus resultierende Targeting-Effizienz ist für jeden der ORFs gezeigt. Für die molekularen Tags, welche zur eindeutigen Markierung der verschiedenen Deletionsstränge verwendet wurden, sind die Sequenz und die x, y-Koordinaten gezeigt.
  • 5 zeigt die in Beispiel 1 beschriebene Tag-Amplifikationsstrategie. (a) Es wurde ein Deletionspool erzeugt, indem gleiche Anzahlen der elf in 3 beschriebenen mit Tags versehenen Deletionsstränge kombiniert wurden. Aus einem repräsentativen Aliquot des Pools isolierte genomische DNA wurde als Template für eine Tag-Amplifikationsreaktion verwendet. (b) Die Tags wurden amplifiziert unter Verwendung eines einzelnen Primerpaares, welches homolog ist zu den gemeinsamen Primingstellen, die jedes Tag flankieren. Einer der gemeinsamen Primer ist mit 5'-Fluoreszein markiert und beinhaltete einen 10-fachen Überschuss gegenüber dem unmarkierten Primer. (c) Die asymmetrische Natur der PCR erzeugt eine Population von einzelsträngigen fluoreszenzmarkierten 60-mer-Tag-Amplikons, welche direkt an das 20-mer-Array mit hoher Dichte hybridisiert sind, welches dann gewaschen und gescannt wird. (d) Ein reales gescanntes Bild des Arrays zeigt das (vorausgesagte) Hybridisierungsmuster für die Tags mit praktisch keiner Kreuzhybridisierung auf dem Rest des Chips. Eine vergrößerte Ansicht der linken Ecke zeigt die Lage der Tags für jeden der unterschiedlichen Deletionsstränge.
  • 6 zeigt die Analyse eines Deletionspools enthaltend 11 mit Tags versehene auxotrophe Deletionsstränge. Es wurde ein Deletionspool erzeugt, indem gleiche Anzahlen von Zellen aus jedem der 11 in 3 beschriebenen Deletionsstränge kombiniert wurden. Repräsentative Aliquots wurden in (A) kompletten Medien (SDC), (B) in Medien ohne Adenin (SDC-ADE), (C) oder in Medien ohne Tryptophan (SDC-TRP) gezüchtet. Die Zellen wurden zu den angegebenen Zeitpunkten geerntet und genomische DNA wurde isoliert. Die Tags wurden aus der genomischen DNA amplifiziert und markierte Amplikons wurden für 30 Minuten direkt an das Array mit hoher Dichte hybridisiert, gewaschen und gescannt. Eine Vergrößerung der oberen linken Ecke ist für jeden der Scans gezeigt.
  • DEFINITIONEN
  • Sofern nicht anderweitig definiert, haben die hierin verwendeten technischen und naturwissenschaftlichen Fachbegriffe die gleiche Bedeutung, wie sie gemeinhin von einem Fachmann auf dem Gebiet der vorliegenden Erfindung verstanden wird. Singleton et al. (1994) Dictionary of Microbiology and Molecular Biology, zweite Auflage, John Wiley and Sons (New York), und March (March, Advanced Organic Chemistry Reactions, Mechanisms and Structure, 4. Aufl., J. Wiley and Sons (New York, 1992), liefern dem Fachmann einen allgemeinen Leitfaden für viele der in der vorliegenden Erfindung verwendeten Begriffe.
  • Wenngleich der Fachmann erkennen wird, dass es viele Verfahren und Materialien zur möglichen Verwendung bei der praktischen Durchführung der vorliegenden Erfindung gibt, die den hierin beschriebenen ähnlich oder gleichwertig sind, so werden dennoch die bevorzugten Verfahren und Materialien beschrieben. Für die Zwecke der vorliegenden Erfindung werden nachstehend die folgenden Begriffe definiert.
  • "Eukaryotische" Zellen sind Zellen, welche zumindest einen Nukleus enthalten, in dem die genomische DNA der Zelle organisiert ist, oder welche differenzierte Abkömmlinge von Zellen sind, die zumindest einen Nukleus enthielten. Eukaryoten unterscheiden sich von Prokaryoten, welche zelluläre Organismen sind, die ihre genomische DNA im Zytoplasma der Zelle tragen.
  • Ein "Nukleosid" ist ein Pentoseglykosid, in welchem das Aglykon eine heterozyklische Base ist; beim Hinzufügen einer Phosphatgruppe wird die Verbindung zu einem Nukleotid. Die bedeutendsten biologischen Nukleoside sind β-Glykosidderivate von D-Ribose oder D-2-Desoxyribose. Nukleotide sind Phosphatester von Nukleosiden, welche aufgrund ihrer Hydroxygruppen auf dem Phosphat azidisch sind. Die polymerisierten Nukleotide Desoxyribonukleinsäure (DNA) und Ribonukleinsäure (RNA) speichern die genetische Information, welche alle Aspekte der Interaktion eines Organismus mit seiner Umgebung steuert. Die Nukleoside von DNA und RNA sind über Phosphateinheiten, welche an der 3- Position einer bestimmten Pentose und der 5-Position der nächsten Pentose befestigt sind, miteinander verbunden.
  • Eine "Nukleinsäure" ist ein Desoxyribonukleotid- oder Ribonukleotidpolymer in entweder einzel- oder doppelsträngiger Form und umfasst, soweit nicht anderweitig beschränkt, bekannte Analoga von natürlichen Nukleotiden, die in ähnlicher Weise funktionieren wie natürlich vorkommende Nukleotide.
  • Ein "Oligonukleotid" ist ein Nukleinsäurepolymer, welches aus zwei oder mehr Nukleotiden oder Nukleotidanaloga zusammengesetzt ist. Ein Oligonukleotid kann aus natürlichen Quellen derivatisiert werden, wird aber oftmals chemisch synthetisiert. Es kann eine beliebige Größe aufweisen.
  • Ein "Oligonukleotidarray" ist ein räumlich definiertes Muster von Oligonukleotidsonden auf einem festen Träger. Ein "präselektioniertes Array aus Oligonukleotiden" ist ein Array aus räumlich definierten Oligonukleotiden auf einem festen Träger, der vor seiner Konstruktion geplant wird (d.h. die Anordnung von Polymeren auf einem/dem festen Substrat während der Synthese ist nicht zufällig, sondern beabsichtigt).
  • Ein in der standardgemäßen automatisierten Oligonukleotidsynthese verwendetes "Nukleinsäurereagens" trägt typischerweise ein geschütztes Phosphat auf dem 3'-Hydroxyl der Ribose. Folglich werden Nukleinsäurereagenzien als Nukleotide, Nukleotidreagenzien, Nukleosidreagenzien, Nukleosidphosphate, Nukleosid-3'-Phosphate, Nukleosidphosphoramidite, Phosphoramidite, Nukleosidphosphonate, Phosphonate und dergleichen bezeichnet. Es wird im Allgemeinen verstanden, dass Nukleotidreagenzien eine geschützte Phosphatgruppe tragen, um eine Phosphodiester-Kopplung zu bilden.
  • Eine "Schutzgruppe", wie hierin verwendet, bezeichnet eine jede der Gruppen, welche dafür vorgesehen sind, eine reaktive Stelle in einem Molekül zu blockieren während eine chemische Reaktion an einer anderen reaktiven Stelle durchgeführt wird. Genauer gesagt kann es sich bei den hierin verwendeten schützenden Gruppen um eine jede der Gruppen handeln, welche beschrieben sind in Greene, et al., Protective Groups In Organic Chemistry, 2. Aufl., John Wiley & Sons, New York, NY, 1991, welches hierin durch Bezugnahme einbezogen ist. Die korrekte Auswahl von schützenden Gruppen für eine bestimmte Synthese wird durch die insgesamt in der Synthese angewandten Verfahren bestimmt. Beispielsweise handelt es sich bei den schützenden Gruppen bei der hierin besprochenen "lichtgesteuerten" Synthese typischerweise um photolabile Schutzgruppen so wie NVOC, MeNPoc sowie die Gruppen, welche in der ebenfalls anhängigen Anmeldung PCT/US93/10162 (eingereicht am 22. Oktober 1993), hierin durch Bezugnahme einbezogen, offenbart sind. In anderen Verfahren werden Schutzgruppen durch chemische Verfahren entfernt und schließen Gruppen ein wie FMOC, DMT und andere dem Fachmann bekannte Gruppen.
  • Ein "festes Substrat" weist eine fixierte organisatorische Trägermatrix auf, so wie Siliziumdioxid, Polymermaterialien oder Glas. In manchen Ausführungsformen ist mindestens eine Oberfläche des Substrats partiell eben. In anderen Ausführungsformen ist es wünschenswert, Bereiche des Substrats physikalisch voneinander zu trennen, um Synthesebereiche abzugrenzen, z. B. durch Furchen, Rillen, Wells oder dergleichen. Beispiele für feste Substrate schließen Slides, Beads und polymere Chips ein. Ein fester Träger wird "funktionalisiert", um die Kopplung von bei der Polymersynthese verwendeten Monomeren zu gestatten. Beispielsweise wird ein fester Träger gegebenenfalls durch eine kovalente Kopplung an den 3'-Kohlenstoff auf einer Furanose an ein Nukleosidmonomer gekoppelt. Typischerweise sind feste Trägermaterialien während der Polymersynthese nicht reaktiv und stellen so einer Grundlage zur Verankerung des wachsenden Polymers bereit. Feste Trägermaterialien schließen ein, sind jedoch nicht beschränkt auf, Glas, Siliziumdioxid, poröses Glas ("controlled pore glass" CPG), Polystyrol, Polystyrol/Latex und mit Carboxyl modifiziertes Teflon. Die festen Substrate sind biologisch, nicht-biologisch, organisch, anorganisch oder eine beliebige Kombination daraus; sie liegen vor als Partikeln, Stränge, Niederschläge, Gels, Sheets, Röhren, Kugeln, Container, Kapillaren, Pads, Filme, Platten, Objektträger etc., je nach ihrer spezifischen Verwendung. Bei lichtgesteuerten Syntheseverfahren ist das feste Substrat oft eben, nimmt aber gegebenenfalls alternative Oberflächenkonfigurationen an. Beispielsweise enthält das feste Substrat gegebenenfalls erhöhte oder vertiefte Bereiche, auf welchen die Synthese stattfindet. In manchen Ausführungsformen ist das feste Substrat so ausgewählt, dass es geeignete Lichtabsorptionseigenschaften aufweist. Beispielsweise kann es sich bei dem Substrat handeln um einen polymerisierten Langmuir-Blodgett-Film, funktionalisiertes Glas, Si, Ge, GaAs, GaP, SiO2, SiN4, modifiziertes Silizium oder jegliches aus einer Vielzahl von Gels oder Polymeren, so wie (Poly-) Tetrafluorethylen, (Poly-) Vinylidendifluorid, Polystyrol, Polycarbonat oder Kombinationen davon. Andere geeignete Materialien für feste Substrate werden für den Fachmann leicht offensichtlich sein. Vorzugsweise wird die Oberfläche des festen Substrats reaktive Gruppen so wie Carboxyl, Amino, Hydroxyl, Thiol und dergleichen enthalten. Noch mehr bevorzugt ist die Oberfläche optisch transparent und weist Oberflächen-Si-OH-Funktionalitäten auf, so wie sie auf Siliziumdioxidoberflächen vorzufinden sind. Ein Substrat ist ein Material mit einer starren oder halbstarren Oberfläche. In Spritz- oder Fließ-VLSIPSTM-Techniken ist gegebenenfalls mindestens eine Oberfläche auf dem festen Substrat eben, wenngleich es in vielen Ausführungsformen wünschenswert ist, Synthesebereiche für verschiedene Polymere z. B. durch Wells, erhöhte Bereiche, geätzte Furchen oder dergleichen physikalisch abzutrennen. In manchen Ausführungsformen enthält das Substrat selbst Wells, Furchen, Durchflussbereiche etc, welche die Bereiche, auf denen die Polymersynthese stattfindet, ganz oder partiell ausmachen.
  • In Bezug auf eine Zelle oder ein Virus verwendet, zeigt der Begriff "rekombinant" an, dass die Zelle oder das Virus eine DNA oder RNA kodiert, deren Ursprung außerhalb der Zelle oder des Virus liegt. Folglich exprimieren rekombinante Zellen z. B. gegebenenfalls Nukleinsäuren (z. B. RNA), welche in der nativen (nicht-rekombinanten) Form der Zelle nicht vorzufinden sind.
  • "Stringente" Hybridisierungsbedingungen sind sequenzabhängig und werden bei verschiedenen Umgebungsparametern (Salzkonzentrationen), Anwesenheit von organischen Substanzen, etc.) unterschiedlich sein. Im Allgemeinen werden stringente Bedingungen so ausgewählt, dass sie bei einer definierten Ionenstärke und definiertem pH-Wert etwa 5°C bis 20°C niedriger als der thermische Schmelzpunkt (Tm) der spezifischen Nukleinsäuresequenz sind. Vorzugsweise sind stringente Bedingungen etwa 5°C bis 10°C niedriger als der thermische Schmelzpunkt für eine spezifische Nukleinsäure, welche an eine komplementäre Nukleinsäure gebunden ist. Tm ist die Temperatur (bei definierter Ionenstärke und definiertem pH-Wert), bei der 50% einer Nukleinsäure (z. B. Tagnukleinsäure) an eine perfekt gepaarte Sonde hybridisieren. Die "thermische Bindungsstabilität" ist ein Maß für die temperaturabhängige Stabilität eines Nukleinsäureduplexes in Lösung. Die thermische Bindungsstabilität für ein Duplex hängt ab von dem Lösungsmittel, der Basenzusammensetzung des Duplexes, der Anzahl und dem Typ von Basenpaaren, der Position von Basenpaaren in dem Duplex, der Länge des Duplexes und dergleichen.
  • "Stringente" Waschbedingungen werden für gewöhnlich für die Hybridisierung eines jeden Satz von Tags an ein korrespondierendes Sondenarray empirisch bestimmt. Die Arrays werden zunächst hybridisiert (typischerweise unter stringenten Hybridisierungsbedingungen) und dann mit Puffern gewaschen, welche immer geringer werdende Konzentrationen von Salzen und/oder immer höher werdende Konzentrationen an Detergenzien und/oder steigende Temperaturen aufweisen, bis der Störabstand zwischen spezifischer und nichtspezifischer Hybridisierung ausreichend groß ist, um die Detektion der spezifischen Hybridisierung zu erleichtern.
  • Stringente Temperaturbedingungen schließen üblicherweise Temperaturen über etwa 30°C, noch gebräuchlicher über etwa 37°C und gelegentlich über etwa 45°C ein. Stringente Salzbedingungen sind normalerweise geringer als etwa 1.000 mM, üblicherweise geringer als etwa 500 mM, noch gebräuchlicher geringer als etwa 400 mM, typischerweise geringer als etwa 300 mM, bevorzugt geringer als etwa 200 mM und noch mehr bevorzugt geringer als etwa 150 mM. Die Kombination der Parameter ist jedoch wichtiger als die Größe eines beliebigen einzelnen Parameters. Siehe z. B. Wetmur und Davidson (1968) J. Mol. Biol. 31: 349-370 und Wetmur (1991) Critical Reviews in Biochemistry and Molecular Biology 26(3/4), 227-259.
  • Der Begriff "identisch" im Zusammenhang mit zwei Nukleinsäuresequenzen bezieht sich auf die Reste in den beiden Sequenzen, welche bei einer Ausrichtung für maximale Korrespondenz gleich sind. Die optimale Ausrichtung der Sequenzen zum Vergleich kann z. B. durchgeführt werden mittels des Homologielokalenalgorithmus von Smith und Waterman, Adv. Appl. Math. 2: 482 (1981), mittels des Homologieausrichtungsalgorithmus von Needleman und Wunsch, J. Mol. Biol. 48: 443 (1970), mittels des Ähnlichkeitensuchverfahrens von Pearson und Lipman, Proc. Natl. Acad. Sci. (U.S.A.) 85: 2444 (1988), mittels computerisierter praktischer Umsetzungen dieser Algorithmen (GAP, BESTFIT, FASTA und TFASTA im Wisconsin Genetics Software Paket, Genetics Computer Group, 575 Science Dr., Madison, WI), oder mittels Kontrolle.
  • Ein Nukleinsäure "tag" ist eine ausgewählte Nukleinsäure mit einer spezifizierten Nukleinsäuresequenz. Eine Nukleinsäure "sonde" hybridisiert an einen Nukleinsäure "tag". In einer typischen Konfiguration werden Nukleinsäuretags als Markierungen in biologische Bibliotheken eingebaut und die Nukleinsäuretags werden unter Verwendung eines VLSIPSTM-Arrays aus Sonden detektiert. Folglich funktioniert der Nukleinsäure "tag" in analoger Weise wie eine Barcodemarkierung und das VLSIPSTM-Array aus Sonden funktioniert in analoger Weise wie ein Barcodemarkierungslesegerät. Eine "Liste von Nukleinsäuretags" ist ein Pool von Nukleinsäuretags oder eine Darstellung (d.h. in elektronischer oder gedruckter Form) der Sequenzen in dem Pool von Nukleinsäuretags. Der Pool von Tags kann z. B. aus allen in Frage kommenden Tags einer spezifizierten Länge (d.h. alle 20-mere) oder einer Teilmenge davon bestehen.
  • Ein Satz von Nukleinsäuretags bindet mit "minimaler Kreuzhybridisierung" an eine Sonde, wenn eine einzelne Spezies (oder ein "Typ") von Tag in dem Satz von Tags die Mehrheit aller Tags ausmacht, welche unter stringenten Bedingungen an ein Array umfassend eine Sondenspezies binden. Typischerweise sind unter stringenten Bedingungen etwa 80% oder mehr der an die Sondenspezies gebundenen Tags von einer einzigen Spezies. Üblicherweise sind unter stringenten Bedingungen etwa 90% oder mehr der an die Sondenspezies gebundenen Tags von einer einzigen Spezies. Bevorzugt sind unter stringenten Bedingungen 95% oder mehr der an die Sondenspezies gebundenen Tags von einer einzigen Spezies.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • Die vorliegende Offenbarung stellt Verfahren zu Auswahl und Detektion von Sätzen von Nukleinsäuretags bereit. Zusätzlich stellt die vorliegende Offenbarung Arrays aus Nukleinsäuresonden zur Detektion von Nukleinsäuretags, Sätzen von Nukleinsäuretags und Zellen, welche Nukleinsäuretags umfassen, bereit. Die Nukleinsäuretags, Nukleinsäuresondenarrays und mit Nukleinsäuretags transformierten Zellen finden eine Vielzahl von Verwendungen. Am gebräuchlichsten werden die Nukleinsäuretags der vorliegenden Erfindung verwendet, um Zellen mit bekannten genotypischen Markern zu markieren (Mutanten, Polymorphismen etc.) und um die Auswirkung von Veränderungen in der Umgebung auf die Lebensfähigkeit der mit Tags versehenen Zellen zu verfolgen.
  • Beispielsweise wurden bei Abschluss der Sequenzierung von S. cerevisiae Tausende von offenen Leserahmen (ORFs) identifiziert. Eine Strategie zur Bestimmung der Funktion der identifizierten ORFs ist es, Deletionsmutanten für jeden ORF zu kreieren und danach die resultierenden Deletionsmutanten unter einer großen Vielzahl von selektiven Bedingungen zu analysieren. Typischerweise ist es das Ziel einer solchen Analyse, einen Phänotypen zu bestimmen, welcher die Funktion des fehlenden ORF aufzeigt. Würde die Analyse für jede Deletionsmutante in einem separaten Experiment durchgeführt, so wären sowohl der Zeit- als auch der Kostenaufwand zur Überwachung der Auswirkung einer Veränderung eines Umgebungsparameters auf jede Deletionsmutante viel zu groß. Beispielsweise würden zur Identifizierung der ORFs, welche zur Synthese einer Aminosäure notwendig sind, alle der Tausenden von ORF-Deletionsmutanten einzeln auf die Fähigkeit der Mutante getestet werden, in Medien ohne die betreffende Aminosäure zu wachsen. Selbst wenn die Analyse parallel durchgeführt würde, z. B. unter Verwendung von 96-Well-Platten, so wäre der erforderliche Aufwand zur Plattierung, Organisation, Markierung und Verfolgung eines jeden Klons viel zu groß. Die vorliegende Erfindung stellt eine wesentlich kostengünstigere Vorgehensweise für das Screening von Zellen bereit.
  • In den Verfahren der vorliegenden Erfindung können alle der zuvor beschriebenen Tausenden von Deletionsmutanten parallel in einem einzigen Experiment getestet werden. Die Deletionsmutanten werden jeweils mit einem Nukleinsäuretag versehen und die Deletionsmutanten werden dann gepoolt. Die gepoolten, mit Tags versehenen Deletionsmutanten werden dann gleichzeitig hinsichtlich ihrer Antwort auf einen Umgebungsreiz getestet (z. B. Wachstum in Medium, welchem eine Aminosäure fehlt). Die deletionszellenspezifischen Tags werden dann unter Verwendung eines Sondenarrays, so wie eines VLSIPSTM-Arrays, ausgelesen. Analog agieren die deletionszellenspezifischen Nukleinsäuretags folglich als Barcode-Markierungen für die Zellen und das VLSIPSTM-Array agiert als ein Barcodelesegerät.
  • Während das zuvor genannte Beispiel spezifisch die Markierung von Hefezellen diskutiert, wird der Fachmann leicht erkennen können, dass im wesentlichen jeder Zelltyp mit den erfindungsgemäßen Nukleinsäuretags markiert werden kann, einschließlich Prokaryoten, Eukaryoten und Archebakterien. Auch kann im Wesentlichen jedes Virus in ähnlicher Weise markiert werden, ebenso wie zelluläre Organellen mit Nukleinsäuren (Mitochondrien, Chloroplasten, etc.). Genau genommen ist die Markierung mittels Nukleinsäuretags und die Detektion mittels Sondenarrays in keiner Weise auf biologische Materialien beschränkt. Der Fachmann wird erkennen, dass viele andere Zusammensetzungen ebenfalls mittels Nukleinsäuretags markiert und mittels Sondenarrays detektiert werden können. Im wesentlichen kann alles, was von der Anfügung einer Markierung profitiert, markiert und mittels der Tags, Arrays und Verfahren der vorliegenden Erfindung detektiert werden. Beispielsweise können große Geldscheine, Originalkunstwerke, wertvolle Briefmarken, bedeutende juristische Dokumente so wie Testamente, Besitzurkunden und Verträge mit Nukleinsäuretags markiert und die Tags unter Verwendung von Sondenarrays ausgelesen werden. Verfahren zur Befestigung an und Abtrennung von vielen Substraten sind in der Technik wohlbekannt, einschließend Glas, Polymere, Papier, Keramik und dergleichen, und diese Techniken können bei den Nukleinsäuretags der vorliegenden Erfindung angewandt werden.
  • Der Fachmann wird ebenfalls anerkennen, dass, während viele der Beispiele hierin die Verwendung eines einzelnen Nukleinsäuretags zur Markierung einer Zelle beschreiben, auch multiple Tags zur Markierung einer jeglichen Zelle verwendet werden können, z. B. durch Klonierung multipler Nukleinsäuretags in die Zelle. In ähnlicher Weise können multiple Nukleinsäuretags verwendet werden, um eine Substanz, so wie die zuvor beschriebenen, zu markieren. Tatsächlich werden multiple Markierungen typischerweise bevorzugt, wenn der Zweck der Nukleinsäuretags die Entdeckung von Fälschungen ist. Beispielsweise können die Nukleinsäuretags der vorliegenden Offenbarung verwendet werden, um einen großen Geldschein mit Hunderten oder gar Tausenden von individuellen Tags zu markieren, so dass die Visualisierung des Hybridisierungsmusters der Tags auf einem VLSIPSTM-Array verifiziert, dass der Geldschein echt ist.
  • Der Fachmann wird ebenfalls erkennen, dass es nicht notwendig ist, ein Tag direkt an ein Sondenarray zu hybridisieren, um den im Wesentlichen gleichen Effekt zu erzielen. Beispielsweise werden Nukleinsäuretags optional (und bevorzugt) z. B. mittels PCR oder LCR oder anderer bekannter Amplifikationstechniken amplifiziert und die Amplifikationsprodukte ("Amplikons") an das Array hybridisiert. Beispielsweise schließt ein Nukleinsäuretag optional PCR-Primer-Bindungsstellen ein, oder befindet sich in deren Nähe, welche, wenn sie unter Verwendung von standardgemäßen PCR-Techniken amplifiziert werden, das Nukleinsäuretag oder eine Untersequenz davon amplifizieren. Folglich können Zellen oder andere mit Tags versehene Objekte selbst dann detektiert werden, wenn die Nukleinsäuretags in nur sehr geringen Mengen vorhanden sind. Der Fachmann wird erkennen, dass ein einzelnes Molekül eines Nukleinsäuretags nach der Amplifikation, z. B. mittels PCR, leicht detektiert werden kann. Die Verminderung der Komplexität der Amplifikation einer ausgewählten Mischung von Tags (d.h. es liegen im Vergleich zu einem Pool genomischer DNA relativ wenige Amplikon-Nukleinsäurespezies vor) erleichtert die Analyse des Gemischs von Tags.
  • In einer bevorzugten Ausführungsform werden die Tags so ausgewählt, dass jedem ausgewählten Tag ein komplementäres ausgewähltes Tag zugeordnet ist. Wird ein Tag z. B. in einen Organismus kloniert, so kann das Tag mittels LCR, PCR oder anderer Amplifikationsverfahren amplifiziert werden. Das amplifizierte Tag ist oftmals doppelsträngig. In bevorzugten Ausführungsformen werden Tagsätzen, welche komplementäre Tagsätze einschließen, korrespondierende Sonden für jedes komplementäre Tag zugeordnet. Beide Stränge eines doppelsträngigen Tag-Amplifikationsprodukts werden von dem Sondenarray separat überwacht. Die Hybridisierung eines jeden der Stränge des doppelsträngigen Tags bietet unabhängiges Auslesen hinsichtlich der An- oder Abwesenheit des Nukleinsäuretags in einer Probe.
  • Auswahl von Tag-Nukleinsäuren.
  • Die vorliegende Offenbarung stellt Methoden zur Auswahl von Nukleinsäuretagsätzen bereit, welche zweckmäßig zur Markierung von Zellen und anderen Zusammensetzungen sind, wie zuvor beschrieben. Die durch die Auswahlmethoden bereitgestellten Tagsätze weisen einheitliche Hybridisierungseigenschaften auf (d.h. eine ähnliche thermische Bindungsstabilität an komplementäre Nukleinsäuren), wodurch sich die Tagsätze zur Detektion mittels VLSIPSTM- und anderer Sondenarrays, so wie Southern oder Northern Blots, eignen. Da die Hybridisierungseigenschaften der Tags einheitlich sind, können alle Tags in dem Satz typischerweise unter Verwendung eines einzigen Satzes von Hybridisierungs- und Waschbedingungen detektiert werden. Wie in den nachfolgenden Beispielen beschrieben, wurden verschiedene Auswahlverfahren verwendet, um Listen von etwa 10.000 geeigneten 20-mer-Nukleinsäuretags aus allen in Frage kommenden 20-mer-Sequenzen (etwa 1,200,000,000,000) zu erstellen. Die Synthese eines einzigen Arrays mit 10.000 zu den 10.000 Nukleinsäuretags komplementären Sonden (d.h. zur Detektion der Tags) wurde unter Verwendung von standardgemäßen VLSIPSTM-Techniken durchgeführt, um ein VLSIPSTM-Array herzustellen.
  • Wünschenswerte Nukleinsäuretags weisen verschiedene Eigenschaften auf. Diese schließen unter anderem ein, dass die Hybridisierung der Tags an ihre komplementäre Sonde (d.h. in dem VLSIPSTM-Array) stark und einheitlich ist, dass einzelne Tags nur an ihre komplementären Sonden hybridisieren und nicht signifikant mit zu anderen Sequenztags komplementären Sonden kreuzhybridisieren und dass, falls es mit den Tags assoziierte konstante Regionen gibt (z. B. Klonierungsstellen oder PCR-Primer-Bindungsstellen), die konstanten Regionen nicht an einen korrespondierenden Sondensatz hybridisieren. Weist der ausgewählte Satz von Tags die beschriebenen Eigenschaften auf, so kann jede beliebige Mischung von Tags an ein korrespondierendes Array hybridisiert werden und die Abwesenheit oder Anwesenheit des Tags kann eindeutig bestimmt und quantifiziert werden. Ein weiterer Vorteil eines solchen Satz von Tagses besteht darin, dass das Ausmaß der Bindung eines jeden Satz von Tagses quantifiziert werden kann, was das relative Verhältnis jedes beliebigen individuellen Nukleinsäuretags zu jedem beliebigen anderen Nukleinsäuretag in dem Satz von Tags anzeigt.
  • Die zuvor umrissenen Eigenschaften werden durch das Befolgen einiger oder aller der nachstehend aufgeführten Auswahlschritte zur Selektionierung von Tagsequenzmerkmalen erhalten.
    • (1) Bestimmung aller in Frage kommenden Nukleinsäuretags einer ausgewählten Länge oder mit ausgewählten Hybridisierungseigenschaften. Wenngleich die nachstehenden Beispiele zum Zwecke der Veranschaulichung Methoden zur Auswahl von Tags aus Tagpools einer einzigen Länge bereitstellen, so wird der Fachmann doch erkennen, dass die Tags verschiedene Längen aufweisen können, z. B. in Fällen, in denen die Tags die gleichen (oder sehr ähnliche) Schmelztemperaturen gegen perfekt komplementäre Targets aufweisen. Der Fachmann wird ebenfalls erkennen, dass je nach Anwendung eine Teilmenge aller in Frage kommenden Tags verwendet werden kann. Werden die Tags dazu verwendet, einen Organismus zu detektieren, können z. B. 20-mere, welche nicht in dem Genom des Organismus vorkommen, als Ausgangspunkt für einen Pool von in Frage kommenden Nukleinsäuretags verwendet werden. Beispielsweise ist das gesamte Genom von S. cerevisiae verfügbar. Werden Tags in den Organismus kloniert, so ist es bevorzugt, alle 20-mere, welche natürlich in dem Genom vorkommen, von der Erwägung als Tagsequenzen auszuschließen, damit eingeführte Tagsequenzen in Hybridisierungsassays nicht mit endogenen Sequenzen verwechselt werden. Die Auswahl der Länge des Nukleinsäuretags hängt von den gewünschten Hybridisierungs- und Diskriminierungseigenschaften des Sondenarrays zur Detektion des Tags ab. Im Allgemeinen gilt: je länger das Tag, desto größer die Stringenz der Hybridisierungen und des Waschens der hybridisierten Nukleinsäuren auf dem Array. Längere Tags werden jedoch nicht genauso leicht auf dem Array diskriminiert, da eine einzige Fehlpaarung auf einem langen Nukleinsäureduplex eine weniger destabilisierende Auswirkung auf die Hybridisierung hat als eine einzelne Fehlpaarung auf einem kurzen Nukleinsäureduplex. Es wird vorausgesetzt, dass der Fachmann mit der Theorie und Praxis der Nukleinsäurehybridisierung an ein Nukleinsäurearray umfassend vertraut ist. Zusätzlich zu den Patenten und der vorstehend zitierten Literatur bezüglich der Synthese von VLSIPSTM-Arrays, stellen Gait, ed. Oligonucleotide Synthesis: A Practical Approach, IRL Press, Oxford (1984); W.H.A. Kuijpers, Nucleic Acids Research 18(17), 5197 (1994); K.L. Dueholm, J. Org. Chem. 59, 5767-5773 (1994); S. Agrawal (ed.), Methods in Molecular Biology, Band 20 und Tijssen, (1993) Laboratory Techniques in biochemistry and molecular biology- hybridization with nucleic acid probes, z. B. Teil I, Kapitel 2 "overview of principles of hybridization and the strategy of nucleic acid probe assays", Elsevier, New York, einen grundlegenden Leitfaden zur Nukleinsäurehybridisierung bereit. Im typischsten Fall weisen Tags eine Länge zwischen 8 und 100 Nukleotiden und vorzugsweise zwischen etwa 10 und 30 Nukleotiden auf. Am meisten bevorzugt weisen die Tags eine Länge zwischen 15 und 25 Nukleotiden auf. Beispielsweise weisen die Nukleinsäuretags in einer bevorzugten Ausführungsform eine Länge von etwa 20 Nukleotiden auf.
    • (2) Die Tags werden so ausgewählt, dass keine Komplementarität zwischen einer beliebigen Sonde in einem Array, welches zur Hybridisierung an den Satz von Tags selektioniert wurde, und einer beliebigen konstanten Tagregion vorliegt (konstante Tagregionen werden optional bereitgestellt, um Primerbindungsstellen zu liefern, z. B. zur PCR-Amplifikation des Restes des Tags oder um die ausgewählten Tags wie nachstehend beschrieben zu limitieren). Mit anderen Worten: die komplementäre Nukleinsäure der variablen Region eines Nukleinsäuretags kann nicht an eine beliebige konstante Region des Nukleinsäuretags hybridisieren. Der Fachmann wird erkennen, dass konstante Regionen in Tagsequenzen optional sind und typischerweise dann verwendet werden, wenn eine PCR- oder eine andere Primerbindungsstelle innerhalb des Tags verwendet wird.
    • (3) Die Tags werden so ausgewählt, dass kein Tag an eine Sonde mit nur einer Fehlpaarung hybridisiert (alle Tags unterscheiden sich um mindestens zwei Nukleotide). Je nach Anwendung können gegebenenfalls Tags ausgewählt werden, welche mindestens 2 Fehlpaarungen, 3 Fehlpaarungen, 4 Fehlpaarungen, 5 Fehlpaarungen oder mehr gegenüber einer Sonde aufweisen, die zu dem Tag nicht perfekt komplementär ist. Typischerweise werden alle Tagsequenzen so ausgewählt, dass sie nur an eine perfekt komplementäre Sonde hybridisieren und die nächstgelegene Möglichkeit zur Fehlpaarungshybridisierung mindestens zwei Hybridisierungsfehlpaarungen aufweist. Folglich unterscheiden sich die Tagsequenzen typischerweise um mindestens zwei Nukleotide, wenn sie zur maximalen Korrespondenz ausgerichtet sind. Vorzugsweise unterscheiden sich die Tags um etwa 5 Nukleotide, wenn sie zur maximalen Korrespondenz ausgerichtet sind (z. B. wenn die Tags 20-mere sind). Die Tags werden oftmals so ausgewählt, dass sie keine identischen Serien von Nukleotiden einer bestimmten Länge aufweisen. Sind die Tags z. B. 20-mere, so werden die Tags vorzugsweise so ausgewählt, dass keine zwei Tags Serien von 9 oder mehr Nukleotiden gemeinsam haben. Der Fachmann wird erkennen, dass die Länge der unzulässigen Identität in Abhängigkeit von der ausgewählten Länge des Tags variiert. Es wurde empirisch bestimmt, dass Kreuzhybridisierung in Tagsätzen vorkommt, wenn 20-mer-Tags mehr als etwa 8 aufeinanderfolgende Nukleotide gemeinsam haben.
    • (4) Die Tags werden so ausgewählt, dass keine Sekundärstruktur innerhalb der zur Detektion der zu den Tags komplementären Tags verwendeten komplementären Sonden vorliegt. Dies wird typischerweise bewerkstelligt, indem Tags, welche Untersequenzen von 4 oder mehr komplementären Nukleotiden aufweisen, aus einem ausgewählten Satz von Tags eliminiert werden.
    • (5) Die Tags werden so ausgewählt, dass sich zwischen einem Tag und einer beliebigen assoziierten konstanten Sequenz keine Sekundärstruktur ausbildet. Selbstkomplementäre Tags weisen in Arrays schwache Hybridisierungseigenschaften auf, da die komplementären Abschnitte der Sonden (und der korrespondierenden Tags) aneinander hybridisieren (z. B. Haarnadelstrukturen ausbilden).
    • (6) Die Tags werden so ausgewählt, dass zu den Tags komplementäre Sonden nicht aneinander hybridisieren, wodurch eine Duplexbildung der Tags in Lösung verhindert wird.
    • (7) Weist das Tag mehr als eine konstante Region auf, so werden die konstanten Regionen des Tags so ausgewählt, dass sie nicht mit sich selbst hybridisieren oder keine Haarnadelstrukturen ausbilden.
    • (8) Sind die Tags von einer einzigen Länge, so werden die Tags so ausgewählt, dass sie ungefähr die gleiche und bevorzugt exakt die gleiche gesamte Basenzusammensetzung aufweisen (d.h. das gleiche A + T zu G + C-Verhältnis von Nukleinsäuren). Weisen die Tags unterschiedliche Längen auf, so wird das A + T zu G + C-Verhältnis bestimmt, indem eine thermische Schmelztemperatur für die Tags ausgewählt wird und ein A + T zu G + C-Verhältnis und eine Sondenlänge für jedes Tag mit der ausgewählten thermischen Schmelztemperatur ausgewählt werden.
  • Der Fachmann wird erkennen, dass es eine Reihe von möglichen Arten gibt, die obigen Auswahlschritte durchzuführen. Im typischsten Fall werden die Auswahlschritte unter Verwendung von einfachen Computerprogrammen zur Durchführung der Auswahl in jedem der zuvor umrissenen Schritte durchgeführt; alle diese Schritte werden jedoch optional auch manuell ausgeführt. Die folgenden Strategien werden zu exemplarischen Zwecken bereitgestellt; der Fachmann wird erkennen, dass zum Erhalt ähnlicher Ergebnisse eine Reihe von ähnlichen Strategien angewandt werden können.
  • In einer Ausführungsform wurde die Sekundärstruktur mittels des Tags verhindert und die Hybridisierung unter oder zwischen Paaren von komplementären Sonden (Vorgaben 4, 5 und 6, oben) wurde verhindert, indem 4 Basenuntersequenzen innerhalb der Tags analysiert wurden, welche dynamisch ausgeschlossen wurden, sobald eine beliebige der folgenden Eigenschaften zutraf:
    • (a) Alle Tags mit komplementären Regionen von 4 oder mehr Basen, einschließlich derer, welche sich in der Sequenz überschneiden, und selbstkomplementärer 4-mere. Um die Hybridisierung variabler Tagsequenzen an die konstanten Primersequenzen zu verhindern wurden Regionen von 4 oder mehr Basen in einem Tag, welche vollständig oder teilweise komplementär zu 4 in der konstanten Sequenz enthaltenen Basensequenzen sind, welche durch mindestens 3 Basen voneinander getrennt waren (d.h. die minimale zur Ausbildung einer Haarnadelstruktur erforderliche Trennung).
    • (b) Um die Einheitlichkeit der Hybridisierungsstärke zu gewährleisten wurden Serien von 4-meren ausgeschlossen, welche sich lediglich aus 4 As, 4 Ts oder 4 G oder C-Resten zusammensetzten. Der Ausschluss von Serien von T/A und G/A ist ebenfalls wünschenswert.
  • Gegebenenfalls wird eine weitere Auswahl vorgenommen, um Aspekte der zuvor umrissenen Auswahlschritte zu verfeinern. Beispielsweise können zur Auswahl von Tags, welche mit geringerer Wahrscheinlichkeit kreuzhybridisieren, fixiertere oder beschränktere Basen zum Zwecke der Ausrichtung hinzugefügt werden, die Tags können verlängert werden und es können zusätzliche Codierungserfordernisse auferlegt werden. In einer Ausführungsform wird die durch das obige Verfahren ausgewählten Tags durchgeführt und eine Teilmenge von Tags mit reduzierter Hybridisierung wird ausgewählt. Beispielsweise wird ein erstes Tag aus dem zuvor erzeugten Satz ausgewählt und ein zweites Tag wird aus dem Satz von Tags ausgewählt. Wenn das zweite Tag nicht mit dem ersten Tag kreuzhybridisiert, so verbleibt das zweite Tag in dem Satz von Tags. Wenn es doch kreuzhybridisiert, wird das Tag verworfen. Folglich wird jedes Tag aus der mittels der zuvor umrissenen Verfahren ausgewählten Gruppe mit jedem anderen Tag in der Gruppe verglichen und wird basierend auf dem Vergleich der Hybridisierungseigenschaften ausgewählt oder verworfen. Dieser Vorgang des Vergleichs von einem Tag mit jedem anderen in Frage kommenden Tag in einem Pool von Tags wird als paarweiser Vergleich bezeichnet. Ähnlich wie in den zuvor umrissenen Schritten kann die Kreuzhybridisierung in einem dynamischen Programmierungsverfahren, wie zuvor zur Sequenzausrichtung verwendet, bestimmt werden.
  • Eine Verfeinerung der zuvor genannten Verfahren beinhaltet eine Verrechnung der Unterschiede bei der durch positionelle Auswirkungen von Fehlpaarungen in dem Sonden-Tag-Duplex verursachten Destabilisierung. Die Gesamtanzahl von Fehlpaarungen ist nicht die beste Einschätzung des Hybridisierungspotentials, da das Ausmaß der Destabilisierung in höchstem Maße von sowohl den Positionen als auch den Arten der Fehlpaarungen abhängt. Beispielsweise wirken sich zwei benachbarte fehlgepaarte Basen in einem 20-Nukleotid- Duplex im Allgemeinen weniger destabilisierend aus als zwei in gleichmäßigen Abständen verteilte Fehlpaarungen. Eine genauerer Einschätzung des Kreuzhybridisierungspotentials kann erreicht werden, indem man die beiden Tags unter Verwendung von dynamischer Programmierung oder anderer Verfahren direkt miteinander vergleicht. In diesen Ausführungsformen wird unter Einhaltung der folgenden Regeln (in welchen die Anwesenheit einer konstanten Region in den Tags optional ist) ein Satz von Tagsequenzen erzeugt:
    • (A) Alle Tags weisen die gleiche Länge N und eine ähnliche Basenzusammensetzung auf. Bestimmte Serien von Basen und potentielle Haarnadelstrukturen sind unzulässig (siehe oben).
    • (B) Keine zwei Tagsequenzen enthalten eine identische Untersequenz der Länge n, für einige Schwellenlänge n. Die zweite Regel gestattet schnelles Screening der Mehrzahl der kreuzhybridisierenden Sonden (das Auswahlverfahren ist linear), wobei eine engere Auswahl verbleibt, aus der jedes Sondenpaar hinsichtlich der Ähnlichkeit verglichen wird (dies nimmt eine zum Quadrat der Anzahl der Sonden proportionale Zeitspanne in Anspruch). Bei dem Verfahren handelt es sich im Wesentlichen um eine alphabetische Baumstruktursuche mit der Hinzufügung eines Arrays, um verfolgen zu können, welche n-mere in zuvor erzeugten Tags verwendet wurden. Jedes Mal wenn die Hinzufügung einer Base an das wachsende Tag ein n-mer erzeugt, welches bereits in einem vorhergehenden Tag verwendet wurde, verfolgt das Verfahren den Weg zurück und probiert den nächsten Wert der Base.
    • (C) In diesem Schritt werden Paare von Tags unter Verwendung einer komplexeren Hybridisierungsenergieregel miteinander verglichen. Für jedes Paar von Tags wird die Energie der Hybridisierung eines jeden Tags an das Komplement des anderen berechnet. Überschreitet die Energie einen gewissen Schwellenwert, so wird eines der Tags aus der Liste entfernt. Sonden werden so lange entfernt bis keine den Schwellenwert überschreitenden Paare mehr auf der Liste vorhanden sind. Beispielsweise lautet in einer Ausführungsform die Energieregel wie folgt: ein Punkt für eine Paarung (zwei angrenzende passende Basenpaare), minus 2 Punkte für Fehler, bei denen sich eine einzelne Base auf einem Strang nach außen wölbt und minus 3 Punkte für alle anderen Fehler, einschließlich langer und asymmetrischer Schleifen. Der höchste Ausrichtungswert zwischen jedem Paar von Tags wurde bestimmt unter Verwendung eines dynamischen Programmieralgorithmus mit einem Präprozessor, welcher zur Einleitung eines Vergleichs eine kurze Paarung von mindestens 5 Basen benötigt.
  • Komplexere Energieregeln können durch Verfeinerung der Hybridisierungsregeln in dieses System integriert werden. Zusätzlich können komplexere Regeln zur Berechnung der Hybridisierungsenergie in jedem beliebigen der zuvor genannten Vorgänge angewandt werden. Siehe Vesnaver et al. (1989), Proc. Natl. Acad. Sci. USA 86, 3614-3618; Wetmur (1991), Critical Reviews in Biochemistry and Molecular Biology 26(3/4), 227-259 und Breslauer et al. (1986), Proc. Natl. Acad. Sci. USA 83, 3746-3750.
  • Der unter Anwendung des paarweisen Vergleichs ausgewählte Satz von Tags ist nicht eindeutig. Er ist abhängig von der Reihenfolge der Auswertung der Tags. Beispielsweise enthält die abschließende Liste mehr Tags, die mit A anfangen als mit T, wenn die Tags in alphabetischer Reihenfolge ausgewertet werden. Es kann auch eine komplexere Vorgehensweise zur Erzeugung des größtmöglichen Satzes solcher Tags mit Debruijn-Sequenzen (Sequenzen, in welchen jedes n-mer für irgendeine Länge n exakt einmal vorkommt) angewandt werden. Beispielsweise könnte eine Debruijn-Sequenz, welche alle n-mere integriert, mit Überschneidungen von n-1 in 20-mere aufgeteilt werden und somit die maximale Anzahl der 20-mere ergeben, welche kein n-mer gemeinsam haben. Diese Vorgehensweise wird dahingehend modifiziert, die anderen zuvor umrissenen Vorgaben für Tags zu berücksichtigen. Beispielsweise werden Basenserien typischerweise aus der ursprünglichen Debruijn-Sequenz entfernt und 20-mere mit unausgewogener Basenzusammensetzung oder Palindrome (welche in einer Größenordnung größer als n auftreten) werden in einem der Verarbeitung nachgeschalteten Schritt entfernt.
  • Es sind viele alternative Vorgehensweisen zur Auswahl und zum Ausschluss von Tags möglich. Beispielsweise können alle paarweise auftretenden Energien berechnet werden, bevor irgendwelche in Frage kommenden Tags verworfen werden, und das Tag, das die meisten den Energieschwellenwert überschreitenden Beinahe-Paarungen aufweist, kann verworfen werden. Das verbleibende Tag mit den meisten Beinahe-Paarungen (nicht einschließend die Beinahe-Paarungen mit Tags, die bereits verworfen wurden) kann verworfen werden. Dieser Vorgang wird so lange wiederholt, bis keine Beinahe-Paarungen mehr vorhanden sind.
  • Beispielsweise fehlt den Tags in einer bevorzugten Ausführungsform der zuvor genannten Auswahlverfahren eine konstante Region. Die Tags werden ausgewählt, indem man alle in Frage kommenden n-mere z. B. 20-mere auswählt und Sequenzen eliminiert welche:
    • (i) Serien von 4 × aufweisen, wobei x ein A, T, C, oder G ist (z. B. AAAA);
    • (ii) eine Sekundärstruktur aufweisen, in welcher es zu einer Serie von 4 aufeinanderfolgenden Nukleotiden eine komplementäre passende Serie von 4 Nukleotiden innerhalb des Tags gibt; oder
    • (iii) eine 9-Basen-Untersequenz (oder eine andere ausgewählte Anzahl von Untersequenzen, typischerweise von 5 bis 15) mit einem beliebigen anderen Tag gemeinsam haben.
  • Alle Tags werden dann so ausgewählt, dass sie den gleichen GC-Gehalt aufweisen, wodurch alle Tags ähnliche Schmelztemperaturen bei der Bindung an eine komplementäre Sonde aufweisen. Die Durchführung der zuvor genannten Schritte begrenzt die Anzahl der Tags in dem Satz von Tags auf einen Pool von etwa 50.000 in Frage kommenden Tags, wenn die Tags 20-mere sind.
  • Es wird dann eine paarweise Auswahlstrategie ausgeführt, um einen endgültigen Satz von Tags zu erhalten. Im paarweisen Vergleich wird ein erstes Tag mit jedem anderen Tag in dem Satz von Tags hinsichtlich der Hybridisierung an das Komplement des ersten Tags verglichen. Bindet das erste Tag an ein Target mit einem Hybridisierungsschwellenwert, so wird ein ausgewählter Wert eingehalten, welcher höher als jedes andere Tag in dem in Frage kommenden Satz ist. Bindet ein anderes Tag in dem in Frage kommenden Satz von Tags mit einer über dem ausgewählten Schwellenwert liegenden Hybridisierungsenergie an das Komplement des ersten Tags, so wird das erste Tag verworfen. Dieser Vorgang wird für jedes in dem Pool von in Frage kommenden Tags verbleibende Tag wiederholt. In Beispiel 4 (Tags895.ccp) wird ein in "C" verfasstes Computerprogramm bereitgestellt, welches die zuvor genannten Auswahlschritte durchführt. Eine Veränderung des Schwellenwerts führte zu Sätzen von 0 bis 50.000 Tags. In einer bevorzugten Ausführungsform wurden 9.000 Tags erzeugt.
  • Allgemeiner ausgedrückt werden Tags (oder zu den Tags komplementäre Sonden) ausgewählt, indem Tags, welche kreuzhybridisieren (mit einer ähnlichen Hybridisierungsenergie an die gleiche Nukleinsäure binden), eliminiert werden. Tags binden komplementäre Nukleinsäure dann mit einer ähnlichen Hybridisierungsenergie, wenn eine zu einem Tag komplementäre Nukleinsäure mit einer einen bestimmten Schwellenwert überschreitenden Energie an ein anderes Tag bindet; ist z. B. ein Tag ein perfektes Match für die Sonde, so wird ein zweites Tag ausgeschlossen, wenn es die gleiche Sonde mit einer Hybridisierungsenergie bindet, welche der Hybridisierungsenergie der perfekten Matchsonde ähnlich ist. Bindet das zweite Tag mit typischerweise etwa 80 bis 95% oder mehr, oder noch typischer etwa 90 bis 95% oder mehr, oder am typischsten etwa 95% oder mehr der Energie eines perfekt komplementären Tags an die Sonde, so wird das Tag aus dem Satz von Tags verworfen. Die berechnete Energie kann basieren auf der Stapelenergie verschiedener Basenpaare, dem Energieaufwand für eine Schleife in der hybridisierten Sonden-Tag-Nukleinsäurekette und/oder auf zugeordneten Werten für die Hybridisierung von Basenpaaren oder auf anderen spezifischen Hybridisierungsparametern. Im nachfolgenden Beispiel 2 wurden Tags ausgewählt, indem ähnliche Tags aus einer umfangreichen auf Hybridisierungseigenschaften so wie zugeordnete Stapelwerte für Tag-Sonden-Hybride basierenden Liste in Frage kommender Tags eliminiert wurden.
  • Es werden auch Verfahren angewandt, welche keinen paarweisen Vergleich beinhalten. In einer Ausführungsform wurden die Tags so ausgewählt, dass sie einen konstanten Abschnitt und einen variablen Abschnitt enthielten. Der variable Abschnitt der Tagsequenz war auf Sequenzen beschränkt, welche nicht mehr als einen C-Rest enthalten. Als konstante Region der Tagsequenz wurde 3'(ACTC)4CC ausgewählt. Diese Auswahl von spezifischen Sequenzen erfüllt die zuvor genannte Vorgabe 7 (die konstante Region wurde so ausgewählt, dass sie nicht selbstkomplementär ist). Der Fachmann wird erkennen, dass auch andere konstante Regionen ausgewählt werden können, z. B. wenn eine Primerbindungsstelle oder eine Restriktionsendonukleasenstelle in die Tags integriert ist.
  • Die Vorgabe 2 wird ebenfalls erfüllt, da die Sonde (welche zum variablen Abschnitt des Tags komplementär ist) keine aufeinanderfolgende Region von hybridisierenden Basen aufweist, mit der Ausnahme einer einzelnen auf einigen der Sonden vorhandenen AGT- oder TGA-Sequenz, und selbst diese Sequenzen sind nicht benachbart zu dem variablen Abschnitt des Tags, wo die primäre Hybridisierung stattfindet. Um die Vorgaben (1) und (8) zu erfüllen, werden die Tags so ausgewählt, dass sie die gleiche Länge und den gleichen Gesamtgehalt an G + C aufweisen.
  • Um eine Kreuzhybridisierung zwischen einem Tag und zu anderen Tags komplementären Sonden zu verhindern, wurde ein Satz von Tags ausgewählt, der nicht mit weniger als zwei Fehlern ausgerichtet werden konnte, wobei ein "Fehler" entweder eine Fehlpaarungshybridisierung oder ein überhängendes Nukleotid ist. Dies wurde durch Fixierung der Sequenz der Basen an den Enden der Tags bewerkstelligt. Insbesondere wurde erzwungen, dass die Basen an den Enden der Tags gleich sind. Es wurde erzwungen, dass die Reste an den Enden gleich sind. Insbesondere wurden die Basen so ausgewählt, dass sie am 5'-Ende mit den Resten GA begannen und am 3'-Ende mit entweder einem A- oder einem T-Rest endeten, gefolgt von einem G-Rest. Diese Anordnung hält die Tags von der Paarung mit passenden Sonden mit einem einzelnen überhängenden Nukleotid und ohne andere Fehler ab, da ein Überhang entweder eine G-A- oder eine G-T-Fehlpaarung erzwingt. Diese Anordnung hält des weiteren die Tags davon ab, eine Paarung mit einem einzelnen Deletionsfehler einzugehen, da eine einzelne Deletion dazu führen würde, dass die Sonde und das Tag an einem Ende fehlausgerichtet wären, was eine Fehlpaarung zur Folge hätte. Der Fachmann wird erkennen, dass diese Strategie auf vielerlei Arten modifiziert werden kann, um gleichwertige Ergebnisse zu liefern, z. B. durch eine Basenauswahl, welche zu C-T- oder C-A-Fehlpaarungen führt.
  • Um bei der Tag-Sonden-Hybridisierung Einzelfehlpaarungsfehler zu vermeiden, wurden die nächste bis letzte Base vom 5'-Ende aus so ausgewählt, dass die Anzahl von As plus der Anzahl von Gs in der variablen Region gerade war (wie zuvor bereits bemerkt, ist die nächste bis letzte Base vom 5'-Ende aus entweder ein T oder ein A). Diese Base verhält sich dadurch analog zu einem Paritätsbit in der Codierungstheorie, dass sie erfordert, dass mindestens zwei Unterschiede zwischen jedem beliebigen Paar von Tags in dem Satz von Tags bestehen. Dies trifft zu, weil der GC-Gehalt von allen der ausgewählten Tags der gleiche ist (siehe oben); daher müssen jegliche Basenunterschiede in der variablen Region die Substitution von G- und C-Resten oder von T- und A-Resten umfassen. Die Substitution von weniger als zwei Basen führt jedoch zu einer ungeraden Anzahl von G + A-Resten. Folglich unterscheiden sich mindestens zwei Basen in jedem beliebigen Paar von Tags in dem Satz von Tags, was obiger Vorgabe (3) entspricht. In ähnlicher Weise könnte die Strategie verändert werden, indem man z. B. einen anderen Rest in dem Tag als Paritätsbase auswählt, welcher zuordnet, ob der A + G-Gehalt des Tags gerade ist, oder indem man die obige Strategie so anpasst, dass sie eine gerade Anzahl von T + G-Resten liefert.
  • Es wurde ein Computerprogramm in der Standardprogrammiersprache "C" verfasst, um jeden der Auswahlschritte auszuführen. Der Vollständigkeit halber ist dieses Programm nachfolgend in Beispiel 3 angegeben, es wird jedoch erwartet, dass der Fachmann ähnliche Programme verfassen kann oder die zuvor umrissenen Auswahlschritte manuell durchführen kann, um im wesentlichen ähnliche Ergebnisse zu erhalten. Anstatt jede Sequenz einer ausgewählten Länge hinsichtlich der erwünschten Sequenzmerkmale zu testen, bedient sich Tags.ccp einer reduzierten Baumstruktursuche, um alle Sequenzen zu finden, welche den obigen Vorgaben entsprechen. Wenngleich damit ein hochentwickeltes Auswahlprogramm mit wenigen Verarbeitungsschritten zur Verfügung steht, wird der Fachmann doch erkennen, dass andere Programme verwendet werden können, welche jedes in Frage kommende Tag hinsichtlich einer gewünschten Sequenz testen. Tags.ccp wählt Tagsätze in Abhängigkeit von einer Vielzahl an Parametern aus, einschließlich der konstanten Sequenz, der variablen Sequenz, des GC-Gehalts, der Vorgabe, dass das A + G-Verhältnis ausgeglichen sein soll, und des Verhältnisses der konstanten und variablen Regionen in den Tags des Satz von Tagses. Beispielsweise wurden in einem Experiment eine konstante und eine variable Region ausgewählt. Es wurde eine Länge von 15 Nukleotiden als Länge der variablen Region ausgewählt, als G + C-Gehalt der variablen Region wurden 7 Nukleotide ausgewählt und die gesamte Basenanzahl von A + G wurde so ausgewählt, dass sie gerade war, mit einem Muster von ??N11[AT]?, wobei ? eine ausgewählte fixierte Base ist. Die Parameter ergaben einen Satz von etwa 8.000 Tagsequenzen.
  • Allgemeiner ausgedrückt weist das Problem, einen Satz von Tagsequenzen zu konstruieren, welche nicht kreuzhybridisieren, eine große Ähnlichkeit zu dem Problem auf, in der Codierungstheorie fehlerkorrigierende Codes zu konstruieren. Der primäre Unterschied besteht darin, dass es in der Codierungstheorie kein Korrelat für Insertionen und Deletionen gibt. Dieses Problem ist, wie zuvor gezeigt, dadurch zu erklären, dass innerhalb der Sondensequenzen konstante Regionen vorhanden sind. Diese Strategie wird verallgemeinert durch eine Veränderung des Ortes des Paritätsbits, der erforderlichen Parität oder der Orte der konstanten Regionen. Komplexere Codes sind ebenfalls zweckmäßig, z. B. Codes, welche mehr Unterschiede zwischen Paaren von Tags erfordern. Siehe Blahut (1983), Theory and Practice of Error Control Codes, Addison-Wesley Publishing Company, Menlo Park, CA.
  • Der Fachmann wird ebenfalls erkennen, dass Verfahren des paarweisen Vergleichs in Verbindung mit einem beliebigen anderen Auswahlverfahren angewandt werden. Beispielsweise können die gemäß spezifischer Regeln, so wie die von tags.ccp implementierten, erzeugten Tags unter Verwendung eines beliebigen der hierin beschriebenen Verfahren des paarweisen Vergleichs weiter selektioniert werden.
  • Synthese von Oligonukleotidarrays
  • Oligonukleotidarrays werden so ausgewählt, dass sie zu den zuvor beschriebenen Nukleinsäuretags komplementäre Oligonukleotide aufweisen. Die Synthese von Oligonukleotidarrays ist im Allgemeinen bekannt. Die Entwicklung einer Technologie zur Synthese von immobilisierten Polymeren im großen Maßstab (VLSIPSTM) stellt Verfahren zur Anordnung großer Anzahlen von Oligonukleotidsonden in sehr kleinen Arrays bereit. Pirrung et al., US Patent Nr. 5,143,854 (siehe auch PCT-Anmeldung Nr. WO 90/15070), McGall et al., US Patent Nr. 5,412,087, Chee et al., SN PCT/US94/12305 und Fodor et al., PCT-Anmeldung Nr. WO 92/10092 beschreiben Verfahren zur Herstellung von sehr umfangreichen Oligonukleotidarrays unter Verwendung von z. B. lichtgesteuerten Synthesetechniken. Siehe auch Fodor et al. (1991), Science 251: 767-777; Lipshutz et al. (1995), BioTechniques 19(3): 442-447; Fodor et al. (1993), Nature 364: 555-556; und Medlin (1995), Environmental Health Perspectives 244-246.
  • Wie zuvor beschrieben, sind verschiedene Verfahren zur Herstellung von Oligonukleotidarrays bekannt; dem entsprechend wird hierin kein Versuch unternommen, alle bekannten Verfahren zu beschreiben oder zu katalogisieren. Zu exemplarischen Zwecken werden lichtgesteuerte VLSIPSTM-Verfahren im Nachfolgenden kurz beschrieben. Der Fachmann wird verstehen, dass alternative Verfahren zur Herstellung von Oligonukleotidarrays, so wie das Aufspritzen und/oder Fließenlassen von Reagenzien über definierte Bereiche eines festen Substrats und auf Beads oder Pins basierende Verfahren, ebenfalls bekannt und auf die vorliegende Erfindung anwendbar sind (siehe z. B. US Pat. Nr. 5,384,261, hierin durch Bezugnahme für alle Zwecke einbezogen). In den in diesen Anmeldungen offenbarten Verfahren werden Reagenzien typischerweise dadurch auf das Substrat aufgebracht, dass man Reagenzien zur Polymersynthese auf vorbestimmte Bereiche des festen Substrats fließen lässt oder aufspritzt.
  • Lichtgesteuerte VLSIPSTM-Verfahren sind z. B. in den US Patenten Nr. 5,143,854 und Nr. 5,412,087 zu finden. In den im '854er Patent besprochenen lichtgesteuerten Verfahren wird typischerweise so vorgegangen, dass vorbestimmte Bereiche eines Substrats oder eines festen Trägers aktiviert werden und dann das Substrat mit einer präselektionierten Monomerlösung in Kontakt gebracht wird. Die vorbestimmten Bereiche werden mittels einer Lichtquelle aktiviert, typischerweise durch eine photolithographische Maske. Andere Bereiche des Substrats bleiben inaktiv, da sie durch die Maske von der Illumination abgeschirmt werden. Folglich wird durch ein Lichtmuster definiert, welche Bereiche auf dem Substrat mit einem gegebenen Monomer reagieren. Durch wiederholte Aktivierung von unterschiedlichen Gruppen von vorbestimmten Bereichen und Kontaktieren von verschiedenen Monomerlösungen mit dem Substrat wird auf dem Substrat ein diverses Array von Oligonukleotiden erzeugt. Wenn nötig, werden andere Schritte angewandt, so wie das Abwaschen der unreagierten Monomerlösung von dem Substrat.
  • Die Oberfläche eines festen Trägers wird typischerweise mit Kopplungsgruppen, welche photolabile Schutzgruppen (z. B. NVOC oder MeNPoc) aufweisen, modifiziert und durch eine photolithographische Maske illuminiert, wodurch sich in den illuminierten Bereichen reaktive Gruppen bilden (z. B. typischerweise Hydroxylgruppen). Beispielsweise wird während der Oligonukleotidsynthese ein durch 3'-O-Phosphoramidit (oder ein anderes Nukleinsäuresynthesereagens) aktiviertes Desoxynukleosid (am 5'-Hydroxyl durch eine photolabile Gruppe geschützt) an der Oberfläche präsentiert und eine Kopplung erfolgt an den Stellen, welche im vorangegangenen Schritt dem Licht ausgesetzt waren. Nach der Bedeckung und der Oxidation wird das Substrat abgespült und die Oberfläche wird durch eine zweite Maske illuminiert, um zusätzliche Hydroxylgruppen zur Kopplung zu exponieren. Ein zweites 5'-geschütztes, durch 3'-O-Phosphoramidit aktiviertes Desoxynukleosid (oder ein anderes geeignetes Oligonukleotidmonomer) wird dann dem resultierenden Array präsentiert. Die Zyklen von selektiver Lichtaussetzung und Kopplung werden so lange wiederholt, bis der gewünschte Satz von Oligonukleotiden hergestellt ist.
  • Zusätzlich zu VLSIPSTM-Arrays können auch andere Sondenarrays hergestellt werden. Beispielsweise kann die standardgemäße Southern- oder Northern-Blot-Technologie angewandt werden, um Nukleinsäuresonden an verschiedenen Substraten so wie Papier, Nitrocellulose, Nylon und dergleichen zu fixieren. Da die Herstellung von großen Arrays unter Verwendung von standardgemäßen Technologien schwierig ist, werden VLSIPSTM-Arrays bevorzugt.
  • Herstellung von Tag-Nukleinsäuren und Oligonukleotiden zur Kopplung in Arrays; Synthese von Testnukleinsäuren; Klonierung von Nukleinsäuretags in Zellen
  • Wie zuvor beschrieben, sind einige Verfahren zur Synthese von Oligonukleotidarrays bekannt. In bevorzugten Ausführungsformen werden die Oligonukleotide direkt auf einer festen Oberfläche synthetisiert, wie zuvor beschrieben. In bestimmten Ausführungsformen ist es jedoch zweckmäßig, zunächst die Oligonukleotide zu synthetisieren und diese dann an das feste Substrat zu koppeln, um das gewünschte Array zu bilden. In ähnlicher Weise können Nukleinsäuren im allgemeinen (z. B. Nukleinsäuretags) auf einem festen Substrat synthetisiert und dann von dem Substrat abgetrennt werden, oder sie können in Lösung synthetisiert werden (unter Anwendung chemischer oder enzymatischer Verfahren), oder sie können natürlich vorkommen (d.h. in einer biologischen Probe vorhanden sein).
  • Molekulare Klonierung und Expressionstechniken zur Herstellung von biologischen und synthetischen Oligonukleotiden und Nukleinsäuren sind im Stand der Technik bekannt. Eine große Vielzahl von Klonierungs-, Expressions- und in vitro-Amplifikationsverfahren, welche zur Konstruktion von Nukleinsäuren geeignet sind, sind dem Fachmann wohl bekannt. Beispiele für Techniken und Instruktionen, welche ausreichen, um den Fachmann bei vielen Klonierungsanwendungen zur Expression und Aufreinigung von biologischen Nukleinsäuren (DNA und RNA) anzuleiten, sind zu finden in Berger und Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology, Band 152, Academic Press, Inc., San Diego, CA (Berger); Sambrook et al. (1989), Molecular Cloning – A Laboratory Manual (2. Auflage) Bd. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor Press, NY, (Sambrook); und Current Protocols in Molecular Biology, F.M. Ausubel et al., eds., Current Protocols, ein Gemeinschaftsunternehmen von Greene Publishing Associates, Inc. und John Wiley & Sons, Inc., (1994 Supplement) (Ausubel). Nukleinsäuren so wie Tag-Nukleinsäuren können unter Anwendung von standardgemäßen Klonierungsprotokollen, so wie in Berger, Sambrook und Ausubel beschrieben, in Zellen kloniert werden (wobei rekombinante mit Tags versehene Zellen erzeugt werden).
  • Beispiele für Techniken, welche ausreichend sind, um den Fachmann anzuleiten bei in vitro-Verfahren zur Nukleinsäuresynthese und Amplifikation von Tags und Sonden in Lösung, einschließlich enzymatischer Verfahren so wie der Polymerase-Kettenreaktion (PCR), der Ligase-Kettenreaktion (LCR), der Qβ-Replikasen-Amplifikation (QBR), der auf Nukleinsäuresequenzen basierenden Amplifikation (NASBA), des SDA-Verfahrens (strand displacement amplification), der zyklischen Sondenamplifikationsreaktion (CPR), verzweigte DNA (bDNA) und andere durch DNA- und RNA-Polymerase vermittelte Techniken, sind bekannt. Beispiele für diese und damit verwandte Techniken sind zu finden in Berger, Sambrook und Ausubel, ebenso wie in Mullis et al., (1987), US Patent Nr. 4,683,202; PCR Protocols A Guide to Methods and Applications (Innis et al. eds) Academic Press Inc. San Diego, CA (1990) (Innis); Arnheim & Levinson (1. Oktober 1990); WO 94/11383; Vooijs et al. (1993), Am J. Hum. Genet. 52: 586-597; C & EN 36-47; The Journal Of NIH Research (1991) 3, 81-94; Kwoh et al. (1989), Proc. Natl. Acad. Sci. USA 86, 1173; Guatelli et al. (1990), Proc. Natl. Acad. Sci. LISA 87, 1874; Lomell et al. (1989) J. Clin. Chem 35, 1826; Landegren et al., (1988) Science 241, 1077-1080; Van Brunt (1990), Biotechnology 8, 291-294; Wu und Wallace, (1989), Gene 4, 560; Sooknanan und Malek (1995) Bio/Technology 13, 563-564; Walker et al,. Proc. Natl. Acad. Sci. LISA 89, 392-396) und Barringer et al. (1990), Gene 89, 117. Verbesserte Verfahren zur Klonierung von in vitro amplifizieren Nukleinsäuren sind in Wallace et al., US Pat. Nr. 5,426,039 beschrieben. In einer bevorzugten Ausführungsform werden Nukleinsäuretags vor der Hybridisierung mit VLSIPSTM-Arrays, wie zuvor beschrieben, amplifiziert. Werden Nukleinsäuretags z. B. in Zellen in einer zellulären Bibliothek kloniert, so können die Tags unter Verwendung von PCR amplifiziert werden.
  • Standardgemäße Festphasensynthese von Nukleinsäuren ist ebenfalls bekannt. Oligonukleotidsynthese wird optional auf im Handel erhältlichen Festphasen-Oligonukleotidsynthesegeräten durchgeführt (siehe Needham-Van Devanter et al. (1984), Nucleic Acids Res. 12: 6159-6168) oder sie wird manuell durchgeführt unter Anwendung des von Beaucage et al. (Beaucage et al. (1981), Tetrahedron Letts. 22 (20): 1859-1862) beschriebenen Festphasen-Phosphoramidit-Triester-Verfahrens. Schließlich werden, wie zuvor beschrieben, Nukleinsäuren optional unter Verwendung von VLSIPSTM-Verfahren in Arrays synthetisiert und gegebenenfalls von dem Array abgetrennt. Die Nukleinsäuren können dann gegebenenfalls wieder an einem festen Substrat befestigt werden, um ein zweites Array zu bilden, falls zweckmäßig, oder, falls zweckmäßig, als Nukleinsäuretags verwendet werden oder als Tagsequenzen zur Klonierung in eine Zelle verwendet werden.
  • Markierungen
  • Der Begriff "Markierung" bezieht sich auf eine Zusammensetzung, welche mit spektroskopischen, photochemischen, biochemischen, immunchemischen oder chemischen Mitteln detektiert werden kann. Zweckmäßige Nukleinsäuremarkierungen schließen z. B. ein: 32P, 35S, Fluoreszenzfarbstoffe, Reagenzien mit hoher Elektronendichte, Enzyme (z. B. wie üblicherweise in einem ELISA verwendet), Biotin, Digoxigenin oder Haptene und Proteine, für welche Antiseren oder monoklonale Antikörper erhältlich sind.
  • Eine große Vielzahl von Markierungen, welche zur Markierung von Nukleinsäuren und für Konjugationstechniken geeignet sind, sind bekannt und ausführlich sowohl in der Patent- als auch in der wissenschaftlichen Literatur beschrieben; sie sind allgemein anwendbar auf die vorliegende Erfindung zur Markierung von Nukleinsäuretags oder amplifizierten Nukleinsäuren zur Detektion durch die Arrays der vorliegenden Erfindung. Geeignete Markierungen schließen ein: Radionukleotide, Enzyme, Substrate, Cofaktoren, Inhibitoren, fluoreszierende Reste, chemilumineszente Reste, magnetische Partikeln und dergleichen. Markierungsagenzien schließen z. B. gegebenenfalls ein: monoklonale Antikörper, polyklonale Antikörper, Proteine oder andere Polymere so wie Affinitätsmatrices, Kohlenhydrate oder Lipide. Die Detektion der Nukleinsäuretags erfolgt gemäß einem beliebigen bekannten Verfahren, einschließend Immunblotting, Verfolgen von radioaktiven oder biolumineszenten Markern, Southern Blotting, Northern Blotting, Southwestern Blotting, Northwestern Blotting oder andere Verfahren, welche ein Molekül aufgrund seiner Größe, Ladung oder Affinität verfolgen. Die jeweilige verwendete Markierung oder detektierbare Gruppe und das jeweilige Assay sind keine ausschlaggebenden Aspekte der vorliegenden Erfindung. Der detektierbare Rest kann aus jedem beliebigen Material bestehen, welches eine detektierbare physikalische oder chemische Eigenschaft aufweist. Solche detektierbaren Markierungen wurden auf den Gebieten der Gele, Säulen und der festen Substrate weit entwickelt und im Allgemeinen können in solchen Verfahren zweckmäßige Markierungen auf die vorliegende Erfindung angewandt werden. Folglich ist eine Markierung jede beliebige Zusammensetzung, welche mit spektroskopischen, photochemischen, biochemischen, immunchemischen, elektrischen, optischen oder chemischen Mitteln detektiert werden kann. Zweckmäßige Markierungen in der vorliegenden Erfindung schließen ein: Fluoreszenzfarbstoffe (z. B. Fluoresceinisothiocyanat, Texasrot, Rhodamin und dergleichen), Radiomarkierungen (z. B. 3H, 125I, 35S, 14C oder 32P), Enzyme (z. B. LacZ, CAT, Meerrettichperoxidase, alkalische Phosphatase und andere, üblicherweise verwendet als detektierbare Enzyme, entweder als Markergenprodukte oder in einem ELISA), Nukleinsäureinterkalatoren (z. B. Ethidiumbromid) und kolorimetrische Markierungen so wie Beads aus kolloidalem Gold oder gefärbtem Glas oder Kunststoff (z. B. Polystyrol, Polypropylen, Latex, etc.).
  • Die Markierung wird gemäß im Stand der Technik bestens bekannten Verfahren direkt oder indirekt an die gewünschte Nukleinsäure gekoppelt. Wie zuvor angedeutet, wird eine große Vielzahl an Markierungen verwendet, wobei die Auswahl der Markierung von der erforderlichen Empfindlichkeit, der Konjugierbarkeit der Zusammensetzung, Stabilitätskriterien, dem verfügbaren Instrumentarium und von Entsorgungsvorschriften abhängt. Nicht radioaktive Markierungen werden oft indirekt befestigt. Im Allgemeinen wird ein Ligandenmolekül (z. B. Biotin) kovalent an ein Polymer gebunden. Der Ligand bindet dann an ein Anti-Liganden (z. B. Streptavidin)-Molekül, welches entweder selbst detektierbar oder kovalent an ein Signalsystem gebunden ist, so wie ein detektierbares Enzym, eine fluoreszierende Verbindung oder eine chemilumineszente Verbindung. Es können eine Reihe von Liganden und Anti-Liganden verwendet werden. Besitzt ein Ligand einen natürlichen Anti-Liganden, z. B. bei Biotin, Thyroxin und Cortisol, so kann er in Verbindung mit markierten Anti-Liganden verwendet werden. Alternativ kann jede beliebige Hapten- oder Antigenverbindung in Kombination mit einem Antikörper verwendet werden. Markierungen können ebenfalls direkt an signalerzeugende Verbindungen konjugiert werden, z. B. durch Konjugation mit einem Enzym oder einem Fluorophor. Als Markierungen in Frage kommende Enzyme werden in erster Linie Hydrolasen, insbesondere Phosphatasen, Esterasen und Glykosidasen oder Oxidoreduktasen, insbesondere Peroxidasen sein. Fluoreszierende Verbindungen schließen ein: Fluoreszein und dessen Derivate, Rhodamin und dessen Derivate, Dansyl, Umbelliferon und dergleichen. Chemilumineszierende Verbindungen schließen Luziferin und 2,3-Dihydrophthalazinedione, z. B. Luminol, ein. Dem Fachmann sind Mittel zur Detektion von Markierungen bestens bekannt. Handelt es sich bei der Markierung um eine radioaktive Markierung, so schließen Mittel zur Detektion folglich einen Szintillationszähler oder einen photographischen Film wie in der Autoradiographie ein. Handelt es sich bei der Markierung um eine fluoreszierende Markierung, so kann sie detektiert werden, indem das Fluorochrom mit der geeigneten Wellenlänge angeregt wird und die daraus resultierende Fluoreszenz detektiert wird, z. B. mittels Mikroskopie, visueller Inspektion, über einen photographischen Film, durch die Verwendung von elektronischen Detektoren so wie Ladungskopplungsspeicher (CCDs) oder Photomultiplier und dergleichen. Zur Detektion in VLSIPSTM-Arrays werden fluoreszierende Markierungen und Detektionstechniken, insbesondere Mikroskopie, bevorzugt. In ähnlicher Weise können enzymatische Markierungen durch die Bereitstellung von geeigneten Substraten für das Enzym und die Detektion des daraus resultierenden Reaktionsprodukts detektiert werden. Schließlich werden einfache kolorimetrische Markierungen oftmals einfach durch Wahrnehmen der mit der Markierung assoziierten Farbe detektiert. So erscheint in zahlreichen Dipstick-Assays konjugiertes Gold oftmals pink, während viele konjugierte Beads in der Farbe des Beads erscheinen.
  • Substrate
  • Wie zuvor erwähnt, können je nach Assay die Tag-Nukleinsäuren oder zu den Tag-Nukleinsäuren komplementäre Sonden an eine feste Oberfläche gebunden werden. Im Stand der Technik sind viele Verfahren zur Immobilisierung von Nukleinsäuren an eine Vielzahl von festen Oberflächen bekannt. Beispielsweise handelt es sich bei der festen Oberfläche gegebenenfalls um Papier, oder eine Membran (z. B. Nitrozellulose), eine Mikrotiterplatte (z. B. PVC, Polypropylen oder Polystyrol), ein Reagenzglas (Glas oder Kunststoff), ein Dipstick (z. B. Glas, PVC, Polypropylen, Polystyrol, Latex und dergleichen), ein Mikrozentrifugenröhrchen, oder ein Bead aus Glas, Siliziumdioxid, Kunststoff, Metall oder Polymeren oder um ein anderes wie hierin beschriebenes Substrat. Die gewünschte Verbindung kann kovalent an das Substrat gebunden oder durch nicht-spezifische Bindung nicht-kovalent an dem Substrat befestigt sein.
  • Eine große Vielzahl an organischen und anorganischen Polymeren, sowohl natürlich vorkommend als auch synthetisch hergestellt, können als das Material für die feste Oberfläche verwendet werden. Beispielhafte Polymere schließen ein: Polyethylen, Polypropylen, Poly (4-Methylbuten), Polystyrol, Polymethacrylat, Poly (Ethylenterephthalat), Rayon, Nylon, Poly (Vinylbutyrat), Poylvinylidendifluorid (PVDF), Silikone, Polyformaldehyd, Zellulose, Zelluloseacetat, Nitrocellulose und dergleichen. Andere Materialien, welche je nach Assay geeignet sind, schließen ein: Papier, Glas, Keramik, Metalle, Metalloide, halbleitende Materialien, Zement und dergleichen. Zusätzlich können gelbildende Substanzen so wie Proteine (z. B. Gelatine), Lipopolysaccharide, Silicate, Agarose und Polyacrylamide verwendet werden. Ebenfalls geeignet sind Polymere, welche mehrere wässrige Phasen bilden, so wie Dextrane, Polyalkylenglykole oder oberflächenaktive Substanzen so wie Phospholipide, langkettige (12–24 Kohlenstoffatome) Alkylammoniumsalze und dergleichen. Ist die feste Oberfläche porös, so können je nach der Natur des Systems verschiedene Porengrößen verwendet werden.
  • Bei der Vorbereitung der Oberfläche wird gegebenenfalls eine Mehrzahl verschiedener Materialien eingesetzt, z. B. als Laminate, um verschiedene Merkmale zu erhalten. So können z. B. Proteinbeschichtungen so wie Gelatine verwendet werden, um die nicht-spezifische Bindung zu verhindern, die kovalente Konjugation zu vereinfachen, die Signaldetektion zu verstärken oder dergleichen. Ist eine kovalente Bindung zwischen einer Verbindung und der Oberfläche gewünscht, so wird die Oberfläche im Allgemeinen polyfunktional sein oder polyfunktionalisiert werden können. Funktionelle Gruppen, welche auf der Oberfläche anwesend sein und zur Kopplung verwendet werden können, können einschließen: Karbonsäuren, Aldehyde, Aminogruppen, Cyanogruppen, Ethylengruppen, Hydroxylgruppen, Mercaptogruppen und dergleichen. Zusätzlich zur kovalenten Bindung können eine Reihe von Verfahren zur nicht-kovalenten Bindung einer Assaykomponente angewandt werden.
  • BEISPIELE
  • Beispiel 1: Parallele Analyse von Deletionssträngen von S. cerevisiae.
  • Die vollständige Sequenz des Genoms von S. cerevisiae ist bekannt. Bei der Sequenzierung des Genoms wurden Tausende von offenen Leserahmen identifiziert, welche potentielle Gene oder Genfragmente repräsentieren. Die Funktion von vieler dieser ORFs ist nicht bekannt.
  • Die Genunterbrechung ist ein wirksames Instrument zur Bestimmung der Funktion von unbekannten ORFs in Hefe. Anhand der Sequenz eines ORF ist es möglich, unter Verwendung von standardgemäßen Genunterbrechungstechniken einen Deletionsstrang zu erzeugen. Der Deletionsstrang wird dann unter einer Reihe von selektiven Bedingungen herangezüchtet, um einen Phänotypen zu identifizieren, welcher die Funktion des fehlenden ORF offenbart. Die individuelle Analyse von Tausenden von Deletionssträngen zur Bewertung einer großen Anzahl selektiver Bedingungen ist jedoch impraktikabel.
  • Zur Lösung dieses Problems wurden individuelle ORF-Deletionen mit einem charakteristischen molekularen Tag versehen. Die deletionsspezifischen Tags wurden durch Hybridisierung an ein Oligonukleotidsondenarray mit hoher Dichte ausgelesen, welches zu jedem Tag komplementäre Sondensätze umfasste.
  • Die Molekulartagstrategie beinhaltet eine vier Schritte umfassende Vorgehensweise zur Erzeugung von mit Tags versehenen Deletionssträngen, welche durch selektive Wachstumsassays parallel gepoolt und analysiert werden können.
  • Einzelne Deletionsstränge wurden unter Anwendung einer PCR-Targetingstrategie (Baudin, Ozier-Kalogeropoulos et al. 1993 Nuc. Acids Res. 21(14): 3329-3330) erzeugt. ORF-spezifische molekulare Tags wurden während der Transformation integriert (2). Mit Tags versehene Deletionsstränge wurden gepoolt und es wurden repräsentative Aliquots unter verschiedenen selektiven Bedingungen herangezüchtet. Die molekularen Tags wurden aus den überlebenden Strängen amplifiziert und an ein Array mit hoher Dichte hybridisiert, welches Komplemente zu den Tagsequenzen enthielt (2). Das Array wurde dann gewaschen und unter Verwendung eines hochempfindlichen konfokalen Mikroskops gescannt. Das normierte Signal für jedes Tag spiegelt die relative Abundanz der verschiedenen Deletionsstränge in dem Pool wider. Die Tauglichkeit der Deletionsstränge in dem Pool wurde durch Vergleich der vor und nach dem selektiven Heranzüchten erhaltenen Hybridisierungsmuster bestimmt.
  • Um die Durchführbarkeit der molekularen Tagstrategie zu testen, wurde unter Anwendung des Computerprogramms tags.ccp eine Liste von 9.105 eindeutigen 20-mer-Tagsequenzen erzeugt (siehe unten und Tabelle 1).
  • Tabelle 1
    Figure 00340001
  • Figure 00350001
  • Ein 1,28 cm × 1,28 cm-Array, welches zu den Tagsequenzen komplementäre Sonden umfasste, wurde mittels standardgemäßer lichtgesteuerter VLSIPSTM-Verfahren hergestellt. Das resultierende Sondenarray mit hoher Dichte stellt Sondensätze an bekannten Stellen in dem Array bereit. Fluoreszenz-Imaging unter Verwendung eines konfokalen Mikroskops gestattete die Quantifizierung der Hybridisierungssignale für jeden der 4.500 Sätze von 20-meren auf dem Array (1). Hybridisierungsexperimente mit 120 fluoreszierend markierten 20-mer-Oligonukleotiden zeigte, dass die Arrays empfindlich, quantitativ und in höchstem Maße spezifisch sind.
  • Als Bestandteil einer Durchführbarkeitsstudie wurden unter Verwendung der in 2 beschriebenen Strategie mit Tags versehene Deletionsstränge für elf charakterisierte auxotrophe Hefegene (ADE1, ADE2, ADE3, ADE4, ADES, AROA, AR07, TRP2, TRP3, TRP4 und TPR5) erzeugt. Die zur Erzeugung der Deletionsstränge verwendeten Oligonukleotide sind in 3 beschrieben und die Transformationsergebnisse sind in 4 gezeigt.
  • Die Stränge wurden gepoolt und in kompletten Medien und verschiedenen Drop-out-Medien herangezüchtet. Aus dem Pool extrahierte genomische DNA diente als Template für eine asymmetrische Tagamplifikation unter Verwendung eines zu gemeinsamen, jedes Tag flankierenden Regionen homologen Primerpaares (4). Der Schwund von spezifischen Strängen aus dem Pool wurde quantitativ gemessen, indem die amplifizierten Tags an die Arrays mit hoher Dichte hybridisiert wurden (6A–C).
  • Beispiel 2: Ein Verfahren zur Auswahl von Tags aus einem Pool von Tags
  • Tags (oder zu den Tags komplementäre Sonden) werden ausgewählt, indem man Tags, welche mit einer ähnlichen Hybridisierungsenergie an das gleiche Target binden, eliminiert. Tags binden dann komplementäre Nukleinsäuren mit einer ähnlichen Hybridisierungsenergie, wenn eine zu einem Tag komplementäre Nukleinsäure mit einer einen spezifischen Schwellenwert überschreitenden Energie an ein anderes Tag bindet. Die berechnete Energie basiert auf z. B. der Stapelenergie von verschiedenen Basenpaaren und dem Energiebedarf für eine Schleife in der Kette und/oder auf zugeordneten Werten für die Hybridisierung von Basenpaaren oder auf anderen spezifischen Hybridisierungsparametern. In diesem Beispiel wurden Tags ausgewählt, indem ähnliche Tags eliminiert wurden aus einer langen Liste von in Frage kommenden Tags, welche auf Hybridisierungseigenschaften so wie zugeordneten Stapelwerten für Tag-Sonden-Hybride basierte.
  • Probecmp wurde geschrieben, um eine Liste nicht ähnlicher Tags aus einer langen Liste von Tags zu erzeugen. Tags werden dann als ähnlich angesehen, wenn ein perfektes Match zu einem Tag mit einer einen gewissen spezifischen Schwellenwert überschreitenden Energie an ein anderes Tag bindet. Probecmp vereint drei individuelle Grundideen bei der Auswahl von Tags. Diese Ideen sind:
    • 1) ein Modell zur Berechnung des Bedarfs an Hybridisierungsenergie für Stapel- und Schleifenbildung;
    • 2) Algorithmen zur schnellen Berechnung dieser Energie einschließlich eines rekursiven, stark reduzierten Algorithmus und eines dynamischen Programmieralgorithmus; und
    • 3) eine Hash-Tabelle zum schnellen Auffinden von perfekt passenden Segmenten.
  • Das Modell zur Berechnung des Bedarfs an Hybridisierungsenergie für Stapel- und Schleifenbildung
  • Die berechnete Energie basiert auf der Stapelenergie von verschiedenen Basenpaaren und auf dem Energiebedarf für eine Schleife in der Kette. Beispielsweise kann der Benutzer vorgeben, dass die Energie aus einer TA-Stapelung 2 sei, GC und CG 4 sei, und AC, AG, TC, GT oder TG 3 sei. Mit diesen Werten beträgt A G G T A C G = 3 + 4 + 3 + 2 + 3 + 4 = 19. Der Energiebedarf für Schleifen wird mittels einer Matrix der Schleifengröße auf jedem Strang angegeben:
    Figure 00370001
  • Kommt z. B. die folgende Paarung vor, so ergibt sich eine Schleifengröße von 1 auf dem ersten Strang und von 0 auf dem zweiten Strang. Ein Blick auf die Tabelle zeigt einen Schleifenzuschlag von 5 und eine daraus resultierende Stapelenergie von 14.
  • Figure 00370002
  • Die Algorithmen zur schnellen Berechnung der Hybridisierungsenergie
  • Die Hybridisierungsenergie kann unter Verwendung entweder eines rekursiven Algorithmus oder eines dynamischen Programmieralgorithmus berechnet werden. Der rekursive Algorithmus ist schnell, wenn der Energiebedarf für Schleifen im Verhältnis zur Stapelenergie groß ist. Der dynamische Programmieralgorithmus ist schnell, wenn der Energiebedarf für Schleifen im Verhältnis zur Stapelenergie gering ist.
  • Figure 00370003
  • Beide Algorithmen zur Berechnung der Energie beginnen mit 2 Tags, welche eine perfekte Paarungssequenz mehrerer Basen aufweisen. Dann berechnen sie die Energie der perfekten Paarungssequenz, finden dann die Paarungen, die jeweils zur höchsten Energie vor und nach der Region der perfekten Matches führen. Die gesamte Paarungsenergie ist die Summe aus diesen drei Energien. Da es in diesem Modell keine vorgeschriebene Richtung gibt, kann der gleiche Algorithmus sowohl für die Energie vor dem Match als auch die Energie nach dem Match angewandt werden, indem die Reihenfolgen der Fragmente vor dem Match umgekehrt werden.
  • Ein rekursiver, stark reduzierter Algorithmus
  • Der rekursive Algorithmus probiert alle Zweige der Baumstruktur aus und zieht alle Schleifengrößen in Betracht, die einen Energiebedarf aufweisen, der gering genug ist, dass die größtmögliche Energie für die verbleibenden Paarungen ausreicht. Der Code für den Algorithmus lautet wie folgt:
    Figure 00390001
    Figure 00400001
  • Ein dynamischer Programmieralgorithmus
  • Der dynamische Programmieralgorithmus beginnt mit der Erstellung einer Matrix von zulässigen oder "legalen" Verbindungen zwischen den beiden Fragmenten.
  • Figure 00400002
  • Dann wird, ausgehend von der linken oberen Ecke, jede legale Verbindung in Betracht gezogen und alle vorangegangenen Basen werden identifiziert. Bei vorangegangenen Basen handelt es sich um jedes beliebige legale Basenpaar in dem Rechteck links oberhalb der in Betracht gezogenen Base. In der nachstehenden Figur besitzen die ersten drei legalen Paarungen keine vorangegangene legale Verbindung außer dem (angenommenen) perfekten Match vor dem Fehlpaarungssegment.
  • Figure 00410001
  • Die Werte in diesen Zellen werden durch die Summe der Stapelenergie und des Energiebedarfs für die Schleifen ersetzt.
  • Figure 00410002
  • Der Vorgang wird dann für jede legale Verbindung weiter außen in der Matrix wiederholt. Ist mehr als eine legale Schleife vorhanden, so wird die Schleife mit dem höchsten Wert verwendet. Ist dieser Vorgang abgeschlossen, so ist der Weg, der zum höchsten Zellwert führte, die beste Paarung.
  • Figure 00410003
  • Eine Hash-Tabelle zum schnellen Auffinden von perfekten Matchsegmenten
  • Um den Vergleich eines Tags mit allen anderen Tags in der Liste zu beschleunigen, bedient sich das Programm einer Hash-Tabelle, welche auf alle Ereignisse eines beliebigen gegebenen n-mers in dem Satz von Tags hinweist. Die Hash-Tabelle ist ausgeführt als zwei Arrays aus Strukturen, welche auf Stellen in Tags zeigen. Das erste Array ist 4 hoch n Datensätze lang und das zweite hat die Größe der gesamten Liste von Tags.
  • Figure 00420001
  • So wird eine Datei mit einer Liste aller Tags (oder Sonden) generiert, aus denen die gewünschten Tags auszuwählen sind. Typischerweise sind die Tags einzeln pro Zeile in einer Spalte aufgelistet, z. B. mit der Überschrift "Sonde" oder "Tag". Die obige Analyse wird auf die Datei angewandt und es wird basierend auf dem obigen Verfahren eine Ausgabedatei erzeugt, was eine Liste von Tags ergibt, in welcher kein Tag an das Komplement eines anderen Tag mit einer einen spezifischen Schwellenwert überschreitenden Stapelenergie hybridisiert.
  • Beispiel 3: "tags.ccp"
  • Im Folgenden wird das Computerprogramm tags.ccp, welches in "C" verfasst und bereits zuvor erwähnt wurde, bereitgestellt:
    Figure 00430001
    Figure 00440001
    Figure 00450001
    Figure 00460001
    Figure 00470001
    Figure 00480001
    Figure 00490001
  • Beispiel 4: Tags895.ccp
  • Ein bevorzugtes Verfahren zur Auswahl von Sondenarrays umfasst das Verwerfen aller Sonden aus einem Pool, welche identische 9-mer-Serien aufweisen (und damit die Eliminierung von vielen Tags, die kreuzhybridisieren werden), gefolgt von einem paarweisen Vergleich der verbleibenden Nukleinsäuretags und der Eliminierung der Tags, die an das gleiche Target hybridisieren. Ein beispielhaftes Programm (Tags895.ccp), in "C" verfasst, wird im Folgenden bereitgestellt.
  • Figure 00500001
  • Figure 00510001
  • Figure 00520001
  • Figure 00530001
  • Figure 00540001
  • Figure 00550001
  • Figure 00560001
  • Figure 00570001
  • Die Erfindung wird durch die angehängten Ansprüche definiert.

Claims (10)

  1. Kit umfassend einen Array von 100 bis 100.000 verschiedene Sätze von auf einer Oberfläche immobilisierten experimentellen Oligonukleotidsonden, und einen Satz von Nukleinsäuremarkern, wobei die experimentellen Sonden ausgewählt sind, Sequenzen aufzuweisen, die zu den Sequenzen des Satzes der Nukleinsäuremarker komplementär sind, wobei der Satz von Markern einheitliche Hybridisierungscharakteristika aufweist, so dass alle Marker in dem Satz durch Hybridisierung gegen den Array detektiert werden können, unter Verwendung eines einzigen Satzes an Hybridisierungs- und Waschbedingungen, und wobei jede Sonde auf dem Array nicht kreuzhybridisiert mit Markern, die zu anderen Sonden auf dem Array komplementär sind.
  2. Verfahren zum gleichzeitigen Detektieren einer Vielzahl von Testnukleinsäuren in einer Zielprobe durch Hybridisierung gegen einen Array wie in Anspruch 1 definiert, wobei: (a) der Array Sätze von experimentellen Sonden umfasst, die unter stringenten Bedingungen nicht gegen Zielnukleinsäuren kreuzhybridisieren, wobei jeder Satz eine homogene Population von Oligonukleotidsonden umfasst; und (b) die Testnukleinsäuren in der Zielprobe, die mit Markersequenzen markiert worden sind, die an die experimentellen Sonden auf dem Array binden; und wobei Sequenzen der Marker so gewählt sind, dass alle Marker durch Hybridisierung gegen den Array detektiert werden können, unter Verwendung eines einzigen Satzes an Hybridisierungs- und Waschbedingungen, und so, dass jeder Marker in dem Satz nicht mit den zu anderen Markern in dem Satz komplementären Sonden kreuzhybridisiert.
  3. Verwendung eines Kits nach Anspruch 1, zur gleichzeitigen Detektion einer Vielzahl von Testnukleinsäuren in einem Zielbereich, wobei die Testnukleinsäuren die Marker aus dem Satz von Nukleinsäuremarkern umfassen, durch Hybridisierung der Markernukleinsäuren gegen den Array von Oligonukleotidsonden, wobei der Array Sätze von experimentellen Sonden umfasst, die unter stringenten Bedingungen nicht gegen Zielnukleinsäuren kreuzhybridisieren, wobei jeder Satz eine homogene Population von Oligonukleotidsonden umfasst.
  4. Kit nach Anspruch 1, oder ein Verfahren oder eine Verwendung nach Anspruch 2 oder 3, wobei der Array mehr als 100 verschiedene Sondensätze pro cm2 enthält, gegebenenfalls wobei der Array mehr als 1.000 Sondensätze pro cm2, vorzugsweise mehr als 10.000 pro cm2 enthält.
  5. Kit, Verfahren oder Verwendung nach einem der vorhergehenden Ansprüche, wobei jeder Sondensatz auf dem Array sich von jedem anderen Sondensatz auf dem Array durch die Anordnung von mindestens zwei Nukleotiden unterscheidet.
  6. Kit, Verfahren oder Verwendung nach einem der vorhergehenden Ansprüche, wobei das G + C-Verhältnis der Sonden des Arrays im Wesentlichen identisch ist, und nicht um mehr als 5% variiert.
  7. Verfahren oder Verwendung nach einem der Ansprüche 2 bis 6, wobei die Marker von ungefähr 8 bis 150 Nukleotide, gegebenenfalls zwischen ungefähr 10 und 100 Nukleotide, vorzugsweise zwischen ungefähr 15 und 30 Nukleotide betragen.
  8. Verfahren oder Verwendung nach Anspruch 7, wobei die Marker ungefähr 20 Nukleotide betragen.
  9. Kit, Verfahren oder Verwendung nach einem der vorhergehenden Ansprüche, wobei der Array eine Kontrollsonde umfasst.
  10. Kit, Verfahren oder Verwendung nach einem der vorhergehenden Ansprüche, wobei der feste Träger ausgewählt ist aus der Gruppe bestehend aus Folien, Beads, polymeren Chips, Partikeln, Strängen, Präzipitaten, Gelen, Blättern, Rohr, Kugeln, Behältern, Kapillaren, Kissen, Schnitten, Filmen und Platten.
DE69736215T 1996-04-04 1997-04-03 Verfahren zur Detektion von Zielnukleinsäuren unter Verwendung von Markernukleinsäuren Revoked DE69736215T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US626285 1996-04-04
US08/626,285 US6458530B1 (en) 1996-04-04 1996-04-04 Selecting tag nucleic acids

Publications (2)

Publication Number Publication Date
DE69736215D1 DE69736215D1 (de) 2006-08-10
DE69736215T2 true DE69736215T2 (de) 2007-06-14

Family

ID=24509751

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69736215T Revoked DE69736215T2 (de) 1996-04-04 1997-04-03 Verfahren zur Detektion von Zielnukleinsäuren unter Verwendung von Markernukleinsäuren

Country Status (4)

Country Link
US (3) US6458530B1 (de)
EP (2) EP0799897B1 (de)
AT (1) ATE331810T1 (de)
DE (1) DE69736215T2 (de)

Families Citing this family (288)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE43097E1 (en) * 1994-10-13 2012-01-10 Illumina, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US6013445A (en) * 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
ES2563643T3 (es) * 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
WO1998055657A1 (en) * 1997-06-05 1998-12-10 Cellstore Methods and reagents for indexing and encoding nucleic acids
US6087102A (en) 1998-01-07 2000-07-11 Clontech Laboratories, Inc. Polymeric arrays and methods for their use in binding assays
US6265163B1 (en) 1998-01-09 2001-07-24 Lynx Therapeutics, Inc. Solid phase selection of differentially expressed genes
US6289229B1 (en) 1998-01-20 2001-09-11 Scimed Life Systems, Inc. Readable probe array for in vivo use
WO1999055886A1 (en) * 1998-04-24 1999-11-04 Genova Pharmaceuticals Corporation Function-based gene discovery
US6130046A (en) * 1998-05-04 2000-10-10 Affymetrix, Inc. Techniques for synthesis integrity evaluation utilizing cycle fidelity probes
WO1999067641A2 (en) 1998-06-24 1999-12-29 Illumina, Inc. Decoding of array sensors with microspheres
US6461812B2 (en) 1998-09-09 2002-10-08 Agilent Technologies, Inc. Method and multiple reservoir apparatus for fabrication of biomolecular arrays
US6475440B1 (en) 1998-09-16 2002-11-05 Clontech Laboratories, Inc. Applicator for use in deposition of fluid samples onto a substrate surface
MXPA01005267A (es) * 1998-11-27 2002-04-24 Synaptics Uk Ltd Sensor de posicion.
WO2000043942A2 (en) * 1999-01-25 2000-07-27 Combimatrix Corporation Method for selecting oligonucleotides having low cross-hybridization
GB9902970D0 (en) * 1999-02-11 1999-03-31 Zeneca Ltd Novel matrix
EP1165839A2 (de) * 1999-03-26 2002-01-02 Whitehead Institute For Biomedical Research Universal arrays
ATE553219T1 (de) 1999-04-20 2012-04-15 Illumina Inc Erkennung von nukleinsäurereaktionen auf bead- arrays
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US6346423B1 (en) 1999-07-16 2002-02-12 Agilent Technologies, Inc. Methods and compositions for producing biopolymeric arrays
US6713309B1 (en) 1999-07-30 2004-03-30 Large Scale Proteomics Corporation Microarrays and their manufacture
US6653151B2 (en) 1999-07-30 2003-11-25 Large Scale Proteomics Corporation Dry deposition of materials for microarrays using matrix displacement
US6171797B1 (en) 1999-10-20 2001-01-09 Agilent Technologies Inc. Methods of making polymeric arrays
EP2319939A3 (de) 1999-10-21 2012-09-26 Case Western Reserve University Genexpressionsprofil für entzündliche Darmerkrankung
US6428957B1 (en) 1999-11-08 2002-08-06 Agilent Technologies, Inc. Systems tools and methods of assaying biological materials using spatially-addressable arrays
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US8076063B2 (en) 2000-02-07 2011-12-13 Illumina, Inc. Multiplexed methylation detection methods
US20040023221A1 (en) * 2000-02-10 2004-02-05 Petr Pancoska Method of designing and selecting polynucleotide sequences
US6783985B1 (en) 2000-02-18 2004-08-31 Elitra Pharmaceuticals Inc. Gene disruption methodologies for drug target discovery
JP3581291B2 (ja) 2000-03-14 2004-10-27 日立ソフトウエアエンジニアリング株式会社 ハイブリダイゼーション実験の結果表示方法
JP5508654B2 (ja) 2000-04-14 2014-06-04 コーネル・リサーチ・ファンデーション・インコーポレイテッド リガーゼ検出反応を用いた核酸配列の違いの検出のための位置特定可能なアレイの設計方法
EP1313880A2 (de) * 2000-05-30 2003-05-28 PE Corporation (NY) Methoden zur detektion gewünschter nukleinsäuren mittels kombinierter ligation und amplifizierung
US7700359B2 (en) 2000-06-02 2010-04-20 Novartis Vaccines And Diagnostics, Inc. Gene products differentially expressed in cancerous cells
ES2305087T3 (es) 2000-06-15 2008-11-01 Novartis Vaccines And Diagnostics, Inc. Polinucleotidos relacionados con el cancer de colon.
AU2001283272A1 (en) * 2000-08-11 2002-02-25 Favrille, Inc. A molecular vector identification system
US6911204B2 (en) 2000-08-11 2005-06-28 Favrille, Inc. Method and composition for altering a B cell mediated pathology
AU2001288393A1 (en) * 2000-08-25 2002-03-04 Illumina, Inc. Probes and decoder oligonucleotides
DE10042797C2 (de) * 2000-08-30 2003-12-04 Basf Lynx Bioscience Ag Analysen-Chip
GB0021367D0 (en) * 2000-09-01 2000-10-18 Sec Dep Of The Home Department Improvements in and relating to marking
US6849409B2 (en) 2000-10-16 2005-02-01 Axxima Pharmaceuticals Ag Cellular kinases involved in Cytomegalovirus infection and their inhibition
ATE380883T1 (de) 2000-10-24 2007-12-15 Univ Leland Stanford Junior Direkte multiplex charakterisierung von genomischer dna
US7117095B2 (en) * 2000-11-21 2006-10-03 Affymetrix, Inc. Methods for selecting nucleic acid probes
US7776523B2 (en) 2000-12-07 2010-08-17 Novartis Vaccines And Diagnostics, Inc. Endogenous retroviruses up-regulated in prostate cancer
US7226737B2 (en) * 2001-01-25 2007-06-05 Luminex Molecular Diagnostics, Inc. Polynucleotides for use as tags and tag complements, manufacture and use thereof
WO2002059355A2 (en) * 2001-01-25 2002-08-01 Tm Bioscience Corporation Polynucleotides for use as tags and tag complements, manufacture and use thereof
EP1414840A4 (de) 2001-03-27 2005-04-13 Univ Delaware Genomics-anwendungen für modifizierte oligonukleotide
US7981842B2 (en) 2001-06-08 2011-07-19 Panomics, Inc. Method for detecting transcription factor-protein interactions
US7468244B2 (en) 2001-09-27 2008-12-23 University Of Delaware Polymorphism detection and separation
ATE466020T1 (de) 2001-11-09 2010-05-15 Univ Georgetown Neue isoform des gefässendothelzell wachstumshemmers (vegi)
WO2003044216A2 (en) 2001-11-19 2003-05-30 Parallele Bioscience, Inc. Multiplex oligonucleotide addition and target amplification
US20110151438A9 (en) 2001-11-19 2011-06-23 Affymetrix, Inc. Methods of Analysis of Methylation
DE60326931D1 (de) 2002-01-08 2009-05-14 Novartis Vaccines & Diagnostic In kanzerösen mammazellen differentiell exprimierte genprodukte und ihre verwendungsverfahren
US20030148287A1 (en) * 2002-01-24 2003-08-07 Xianqiang Li Libraries and kits for detecting transcription factor activity
WO2003074733A2 (en) * 2002-03-01 2003-09-12 The Secretary Of State For The Home Department Improvements in and relating to marking
US20030219801A1 (en) * 2002-03-06 2003-11-27 Affymetrix, Inc. Aptamer base technique for ligand identification
EP1900827A3 (de) 2002-05-21 2008-04-16 Bayer HealthCare AG Verfahren und Zusammensetzungen zur Vorhersage, Diagnose, Prognose, Verhinderung und Behandlung maligner Neoplasien
EP2302039A1 (de) 2002-06-13 2011-03-30 Novartis Vaccines and Diagnostics, Inc. Virusähnliche Partikel mit HML-2 gag Polypeptid
US20050032074A1 (en) * 2002-09-09 2005-02-10 Affymetrix, Inc. Custom design method for resequencing arrays
US7595883B1 (en) 2002-09-16 2009-09-29 The Board Of Trustees Of The Leland Stanford Junior University Biological analysis arrangement and approach therefor
AU2003279089A1 (en) * 2002-09-30 2004-04-19 Parallele Bioscience, Inc. Polynucleotide synthesis and labeling by kinetic sampling ligation
US20040086892A1 (en) * 2002-11-06 2004-05-06 Crothers Donald M. Universal tag assay
WO2004065000A1 (en) 2003-01-21 2004-08-05 Illumina Inc. Chemical reaction monitor
EP1947116B1 (de) 2003-02-10 2017-06-21 2-BBB Medicines B.V. Differenziell exprimierte Nukleinsäuren der Blut-Hirnschranke bei einer Entzündung
EP1479780A1 (de) * 2003-05-22 2004-11-24 Institut Pasteur Neues Entwurfsverfahren für Saccharomyces Cerevisiae Sonden, welches die Kreuzhybridisierung minimiert, die erhaltenen Sonden, und deren diagnostische Verwendungen
US20040259100A1 (en) 2003-06-20 2004-12-23 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
US20050049796A1 (en) * 2003-09-03 2005-03-03 Webb Peter G. Methods for encoding non-biological information on microarrays
US7365179B2 (en) * 2003-09-09 2008-04-29 Compass Genetics, Llc Multiplexed analytical platform
EP1685380A2 (de) * 2003-09-18 2006-08-02 Parallele Bioscience, Inc. System und verfahren zur verbesserung der signal-rausch-verhältnisse von messungen auf mikroarray-basis
EP1892306A3 (de) 2003-10-06 2008-06-11 Bayer HealthCare AG Verfahren und Kit zur Untersuchung von Krebs
WO2005047474A2 (en) * 2003-11-10 2005-05-26 Geneohm Sciences, Inc. Nucleic acid detection method having increased sensitivity
US20080138798A1 (en) * 2003-12-23 2008-06-12 Greg Hampikian Reference markers for biological samples
CA2555377A1 (en) * 2004-02-12 2005-09-01 Compass Genetics, Llc Genetic analysis by sequence-specific sorting
US7901881B2 (en) 2004-04-09 2011-03-08 The United States Of America As Represented By The Department Of Health And Human Services Diagnostic tool for diagnosing benign versus malignant thyroid lesions
US20050250147A1 (en) * 2004-05-10 2005-11-10 Macevicz Stephen C Digital profiling of polynucleotide populations
US7622281B2 (en) * 2004-05-20 2009-11-24 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for clonal amplification of nucleic acid
CA2572450A1 (en) 2004-05-28 2005-12-15 Ambion, Inc. Methods and compositions involving microrna
US7702466B1 (en) 2004-06-29 2010-04-20 Illumina, Inc. Systems and methods for selection of nucleic acid sequence probes
US20060019304A1 (en) * 2004-07-26 2006-01-26 Paul Hardenbol Simultaneous analysis of multiple genomes
US20060073506A1 (en) 2004-09-17 2006-04-06 Affymetrix, Inc. Methods for identifying biological samples
JP2008513028A (ja) 2004-09-21 2008-05-01 アプレラ コーポレイション マイクロRNA(miRNA)の二色リアルタイム/エンドポイント定量化
JP2008520191A (ja) 2004-10-27 2008-06-19 バンダービルト・ユニバーシティ 感染に関与する哺乳動物遺伝子
EP2302055B1 (de) 2004-11-12 2014-08-27 Asuragen, Inc. Verfahren und Zusammensetzungen, die miRNAs und miRNAa-inhibitorischen Molekülen verbunden sind
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7407757B2 (en) * 2005-02-10 2008-08-05 Population Genetics Technologies Genetic analysis by sequence-specific sorting
US20060204995A1 (en) * 2005-03-08 2006-09-14 Oh Ji-Young Method of designing probe set, probe set designed by the method, microarray comprising the probe set, computer readable medium recorded thereon program to execute the method, and method of identifying target sequence using the probe set
US20060211030A1 (en) * 2005-03-16 2006-09-21 Sydney Brenner Methods and compositions for assay readouts on multiple analytical platforms
US7368242B2 (en) * 2005-06-14 2008-05-06 Affymetrix, Inc. Method and kits for multiplex hybridization assays
EP2463386B1 (de) 2005-06-15 2017-04-12 Complete Genomics Inc. Nukleinsäureanalyse durch zufällige Mischungen von sich überlappenden Fragmenten
WO2007016367A2 (en) 2005-07-29 2007-02-08 Bayer Healthcare Llc Neoplastic disease-related methods, kits, systems and databases
US20070128611A1 (en) * 2005-12-02 2007-06-07 Nelson Charles F Negative control probes
WO2007087312A2 (en) * 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
EP1842926B1 (de) * 2006-03-10 2015-08-19 Epigenomics AG Verfahren zur Bestimmung einer biologischen Probe zur Methylisierungsanalyse
US7833716B2 (en) 2006-06-06 2010-11-16 Gen-Probe Incorporated Tagged oligonucleotides and their use in nucleic acid amplification methods
EP2442108B1 (de) 2006-07-14 2016-11-16 The Regents of The University of California Krebsbiomarker und Anwendungsverfahren dafür
US20080118910A1 (en) * 2006-08-31 2008-05-22 Milligan Stephen B Control nucleic acid constructs for use with genomic arrays
EP2145001A2 (de) 2006-09-19 2010-01-20 Asuragen, Inc. Von mir-15, mir-26, mir -31,mir -145, mir-147, mir-188, mir-215, mir-216 mir-331, mmu-mir-292-3p regulierte gene und stoffwechselwege als ziele für einen therapeutischen eingriff
WO2008036765A2 (en) 2006-09-19 2008-03-27 Asuragen, Inc. Micrornas differentially expressed in pancreatic diseases and uses thereof
US20080102452A1 (en) * 2006-10-31 2008-05-01 Roberts Douglas N Control nucleic acid constructs for use in analysis of methylation status
WO2009029266A2 (en) 2007-08-27 2009-03-05 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health Of Human Services, National Institutes Of Health Diagnostic tool for diagnosing benign versus malignant thyroid lesions
ES2836128T3 (es) 2008-04-16 2021-06-24 Univ Johns Hopkins Método para determinar variantes del receptor de andrógenos en cáncer de próstata
EP2283163B1 (de) 2008-04-18 2015-07-08 Tufts Medical Center Mit altersbedingter makuladegeneration assoziierte polymorphismen und verfahren zur bewertung von patientenrisiken
EP2113574A1 (de) 2008-04-28 2009-11-04 Biotype AG Stoffe und Verfahren für Profilierungstest auf DNA-Basis
JP2009268665A (ja) * 2008-05-07 2009-11-19 Canon Inc 吸入装置
EP2990487A1 (de) 2008-05-08 2016-03-02 Asuragen, INC. Zusammensetzungen und verfahren in zusammenhang mit der mirna-modulation von neovaskularisation oder angiogenese
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9394567B2 (en) 2008-11-07 2016-07-19 Adaptive Biotechnologies Corporation Detection and quantification of sample contamination in immune repertoire analysis
CN102272327B (zh) 2008-11-07 2015-11-25 赛昆塔公司 通过序列分析监测状况的方法
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US8309306B2 (en) * 2008-11-12 2012-11-13 Nodality, Inc. Detection composition
WO2010083456A1 (en) 2009-01-15 2010-07-22 Imdaptive Inc. Adaptive immunity profiling and methods for generation of monoclonal antibodies
WO2010087702A1 (en) 2009-01-30 2010-08-05 Stichting Katholieke Universiteit TET2 gene as a marker for diagnosing a myelodysuplastic syndrome (MDS) or an acute myeloid leukemia (AML) and determining the prognosis in a subject
EP2411541B1 (de) 2009-03-27 2015-02-11 Tufts Medical Center, Inc. Marker im zusammenhang mit alterbedingter makuladegeneration und ihre verwendung
EP2446052B1 (de) 2009-06-25 2018-08-08 Fred Hutchinson Cancer Research Center Verfahren zur messung der adaptiven immunität
EP2478101A1 (de) 2009-09-16 2012-07-25 Stichting Het Nederlands Kanker Instituut Fra-1-zielgene als wirkstofftargets zur behandlung von krebs
WO2011037990A1 (en) 2009-09-22 2011-03-31 President And Fellows Of Harvard College Entangled mate sequencing
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
EP3214174B1 (de) 2010-03-04 2019-10-16 InteRNA Technologies B.V. Mirna-molekül, das über seine quelle definiert ist, und seine diagnostischen und therapeutischen verwendungen bei mit emt assoziierten krankheiten
EP3508854A1 (de) 2010-04-27 2019-07-10 The Regents of The University of California Krebsbiomarker und verfahren zur verwendung davon
WO2011139372A1 (en) 2010-05-06 2011-11-10 Sequenta, Inc. Sequence analysis of complex amplicons
WO2011146725A1 (en) 2010-05-19 2011-11-24 Bayer Healthcare Llc Biomarkers for a multikinase inhibitor
US8828688B2 (en) 2010-05-27 2014-09-09 Affymetrix, Inc. Multiplex amplification methods
US9353412B2 (en) 2010-06-18 2016-05-31 Illumina, Inc. Conformational probes and methods for sequencing nucleic acids
NZ704322A (en) 2010-07-06 2016-07-29 Interna Technologies Bv Mirna and its diagnostic and therapeutic uses in diseases or conditions associated with melanoma, or in diseases or conditions associated with activated braf pathway
ES2523140T3 (es) 2010-09-21 2014-11-21 Population Genetics Technologies Ltd. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
IN2013MN00522A (de) 2010-09-24 2015-05-29 Univ Leland Stanford Junior
CA2817882C (en) 2010-11-17 2022-08-23 Asuragen, Inc. Mirnas as biomarkers for distinguishing benign from malignant thyroid neoplasms
WO2012102793A2 (en) 2010-12-10 2012-08-02 Zirus, Inc. Mammalian genes involved in toxicity and infection
EP2474617A1 (de) 2011-01-11 2012-07-11 InteRNA Technologies BV MIR zur Behandlung von Neoangiogenese
US9361427B2 (en) 2011-02-01 2016-06-07 The Regents Of The University Of California Scar-less multi-part DNA assembly design automation
WO2012158238A2 (en) 2011-02-28 2012-11-22 University Of Iowa Research Foundation Anti-müllerian hormone changes in pregnancy and prediction ofadverse pregnancy outcomes and gender
US8759036B2 (en) 2011-03-21 2014-06-24 Affymetrix, Inc. Methods for synthesizing pools of probes
US9051619B2 (en) 2011-03-25 2015-06-09 Florida Agricultural and Mechanical University (FAMU) Methods and compositions for prostate cancer metastasis
US10221218B2 (en) 2011-05-10 2019-03-05 The Regents Of The University Of California Adenovirus isolated from titi monkeys
US9267112B2 (en) 2011-05-10 2016-02-23 The Regents Of The University Of California Adenovirus isolated from Titi Monkeys
US10501779B2 (en) 2011-05-12 2019-12-10 President And Fellows Of Harvard College Oligonucleotide trapping
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
US9644241B2 (en) 2011-09-13 2017-05-09 Interpace Diagnostics, Llc Methods and compositions involving miR-135B for distinguishing pancreatic cancer from benign pancreatic disease
CA2853088C (en) 2011-10-21 2018-03-13 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
WO2013063519A1 (en) 2011-10-26 2013-05-02 Asuragen, Inc. Methods and compositions involving mirna expression levels for distinguishing pancreatic cysts
WO2013063544A1 (en) 2011-10-27 2013-05-02 Asuragen, Inc. Mirnas as diagnostic biomarkers to distinguish benign from malignant thyroid tumors
US9824179B2 (en) 2011-12-09 2017-11-21 Adaptive Biotechnologies Corp. Diagnosis of lymphoid malignancies and minimal residual disease detection
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
WO2013087789A1 (en) 2011-12-13 2013-06-20 Glykos Finland Ltd. Antibody isoform arrays and methods thereof
EP3211100A1 (de) 2011-12-22 2017-08-30 Ibis Biosciences, Inc. Amplifikationsprimer und verfahren
ES2776673T3 (es) 2012-02-27 2020-07-31 Univ North Carolina Chapel Hill Métodos y usos para etiquetas moleculares
EP3321378B1 (de) 2012-02-27 2021-11-10 Becton, Dickinson and Company Zusammensetzungen für molekularen zählung
ES2741099T3 (es) 2012-02-28 2020-02-10 Agilent Technologies Inc Método de fijación de una secuencia de recuento para una muestra de ácido nucleico
JP6302847B2 (ja) 2012-03-05 2018-03-28 アダプティヴ バイオテクノロジーズ コーポレーション 頻度が一致したサブユニットからの、対をなす免疫受容体鎖の決定
PL2831276T3 (pl) 2012-05-08 2016-10-31 Kompozycje i sposób oznaczania i kalibracji dla odchylenia amplifikacji w reakcjach multipleksowej pcr
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
WO2014007623A1 (en) 2012-07-03 2014-01-09 Interna Technologies B.V. Diagnostic portfolio and its uses
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP2893040B1 (de) 2012-09-04 2019-01-02 Guardant Health, Inc. Verfahren für den nachweis von seltenen mutationen und von kopienzahlvarianten
WO2014055561A1 (en) 2012-10-01 2014-04-10 Adaptive Biotechnologies Corporation Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization
WO2014055117A1 (en) 2012-10-04 2014-04-10 Asuragen, Inc. Diagnostic mirnas for differential diagnosis of incidental pancreatic cystic lesions
US9476089B2 (en) 2012-10-18 2016-10-25 President And Fellows Of Harvard College Methods of making oligonucleotide probes
US9365896B2 (en) 2012-10-19 2016-06-14 Agilent Technologies, Inc. Addition of an adaptor by invasive cleavage
EP4066841A1 (de) 2013-03-14 2022-10-05 University of Maryland, Baltimore Mittel zur androgenrezeptor-abwärtsregelung und verwendungen davon
WO2014151551A1 (en) 2013-03-15 2014-09-25 Baylor Research Institute Ulcerative colitis (uc)-associated colorectal neoplasia markers
GB2584364A (en) 2013-03-15 2020-12-02 Abvitro Llc Single cell bar-coding for antibody discovery
US9868992B2 (en) 2013-03-15 2018-01-16 Baylor Research Institute Tissue and blood-based miRNA biomarkers for the diagnosis, prognosis and metastasis-predictive potential in colorectal cancer
US9540685B2 (en) 2013-03-15 2017-01-10 President And Fellows Of Harvard College Methods of identifying homologous genes using FISH
WO2014139596A1 (en) 2013-03-15 2014-09-18 Illumina Cambridge Limited Modified nucleosides or nucleotides
EP2970909A4 (de) 2013-03-15 2017-02-15 The University of Chicago Verfahren und zusammensetzungen in zusammenhang mit t-zell aktivität
EP2986717A1 (de) 2013-04-19 2016-02-24 The Regents of The University of California Lone-star-virus
JP6618894B2 (ja) 2013-05-23 2019-12-11 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 個別的エピゲノミクスのための天然クロマチンへの転移
KR102070483B1 (ko) 2013-07-01 2020-01-29 일루미나, 인코포레이티드 촉매-무함유 표면 작용화 및 중합체 그라프팅
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
CN105636594A (zh) 2013-08-12 2016-06-01 托凯药业股份有限公司 使用雄激素靶向疗法用于治疗肿瘤性疾病的生物标记物
KR102536833B1 (ko) 2013-08-28 2023-05-26 벡톤 디킨슨 앤드 컴퍼니 대량의 동시 단일 세포 분석
JP2017504307A (ja) 2013-10-07 2017-02-09 セルラー リサーチ, インコーポレイテッド アレイ上のフィーチャーをデジタルカウントするための方法およびシステム
WO2015060609A2 (ko) 2013-10-21 2015-04-30 주식회사 바이오이즈 올리고뉴클레오타이드를 이용한 생체분자의 분석방법 및 장치
CA2935138C (en) 2013-10-22 2021-04-20 Sung-Chun Kim Marker for generating binding information on biomolecules and nucleic acids, preparation method therefor, and method and apparatus for analyzing biomolecule by using same
WO2015095291A1 (en) 2013-12-19 2015-06-25 Illumina, Inc. Substrates comprising nano-patterning surfaces and methods of preparing thereof
CN111534580A (zh) 2013-12-28 2020-08-14 夸登特健康公司 用于检测遗传变异的方法和系统
WO2015134787A2 (en) 2014-03-05 2015-09-11 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US11390921B2 (en) 2014-04-01 2022-07-19 Adaptive Biotechnologies Corporation Determining WT-1 specific T cells and WT-1 specific T cell receptors (TCRs)
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
ES2777529T3 (es) 2014-04-17 2020-08-05 Adaptive Biotechnologies Corp Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células
EP3146081B1 (de) 2014-05-19 2020-10-28 The Johns Hopkins University Verfahren zur identifizierung von androgenrezeptorspleissvarianten bei patienten mit kastrationsresistentem prostatakrebs
GB201414098D0 (en) 2014-08-08 2014-09-24 Illumina Cambridge Ltd Modified nucleotide linkers
US10174383B2 (en) 2014-08-13 2019-01-08 Vanadis Diagnostics Method of estimating the amount of a methylated locus in a sample
CN107075546B (zh) 2014-08-19 2021-08-31 哈佛学院董事及会员团体 用于对核酸探测并作图的rna-引导的系统
CN107076739B (zh) 2014-08-21 2018-12-25 伊卢米纳剑桥有限公司 可逆表面官能化
EP3186393A4 (de) 2014-08-25 2018-01-10 The Johns Hopkins University Verfahren und zusammensetzungen im zusammenhang mit prostatakrebstherapeutika
EP3194593B1 (de) 2014-09-15 2019-02-06 AbVitro LLC Nukleotidbibliotheksequenzierung mit hohem durchsatz
CA2966201A1 (en) 2014-10-29 2016-05-06 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
ES2772127T3 (es) 2014-10-31 2020-07-07 Illumina Cambridge Ltd Polímeros y recubrimientos de copolímeros de ADN
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
EP3224384A4 (de) 2014-11-25 2018-04-18 Adaptive Biotechnologies Corp. Charakterisierung von adaptiver immunreaktion auf impfungen oder infektionen unter verwendung von immunrepertoiresequenzierung
WO2016090323A1 (en) 2014-12-05 2016-06-09 Prelude, Inc. Dcis recurrence and invasive breast cancer
WO2016134078A1 (en) 2015-02-19 2016-08-25 Becton, Dickinson And Company High-throughput single-cell analysis combining proteomic and genomic information
US10246702B1 (en) 2015-02-23 2019-04-02 New England Biolabs, Inc. Compositions and methods for labeling target nucleic acid molecules
AU2016222788B2 (en) 2015-02-24 2022-03-31 Adaptive Biotechnologies Corp. Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
EP3262192B1 (de) 2015-02-27 2020-09-16 Becton, Dickinson and Company Räumlich adressierbare molekulare barcodierung
EP4180535A1 (de) 2015-03-30 2023-05-17 Becton, Dickinson and Company Verfahren und zusammensetzungen für kombinatorische barcodierung
WO2016161273A1 (en) 2015-04-01 2016-10-06 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target
WO2016172373A1 (en) 2015-04-23 2016-10-27 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
US11124823B2 (en) 2015-06-01 2021-09-21 Becton, Dickinson And Company Methods for RNA quantification
US20180207920A1 (en) 2015-07-17 2018-07-26 Illumina, Inc. Polymer sheets for sequencing applications
CN108026524A (zh) 2015-09-11 2018-05-11 赛卢拉研究公司 用于核酸文库标准化的方法和组合物
CN106536735B (zh) 2015-09-18 2020-01-14 苏州新波生物技术有限公司 分析dna样品的探针集合和使用所述探针集合的方法
EP3353329A4 (de) 2015-09-23 2019-11-20 Oklahoma Medical Research Foundation Biomarker zur beurteilung von subjekten mit multipler sklerose
SG11201805119QA (en) 2015-12-17 2018-07-30 Guardant Health Inc Methods to determine tumor gene copy number by analysis of cell-free dna
AU2017261189B2 (en) 2016-05-02 2023-02-09 Becton, Dickinson And Company Accurate molecular barcoding
KR102171865B1 (ko) 2016-05-18 2020-10-29 일루미나, 인코포레이티드 패턴화된 소수성 표면을 사용한 자가 조립된 패터닝
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
EP3465502B1 (de) 2016-05-26 2024-04-10 Becton, Dickinson and Company Verfahren zur anpassung des zählens von molekularen kennzeichen
US10240196B2 (en) 2016-05-27 2019-03-26 Agilent Technologies, Inc. Transposase-random priming DNA sample preparation
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
CN109642230A (zh) 2016-08-16 2019-04-16 加利福尼亚大学董事会 通过杂交找到低丰度序列(flash)的方法
WO2018045141A1 (en) 2016-09-02 2018-03-08 New England Biolabs, Inc. Analysis of chromatin using a nicking enzyme
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
WO2018057928A1 (en) 2016-09-23 2018-03-29 Grail, Inc. Methods of preparing and analyzing cell-free nucleic acid sequencing libraries
JP7091348B2 (ja) 2016-09-26 2022-06-27 ベクトン・ディキンソン・アンド・カンパニー バーコード付きオリゴヌクレオチド配列を有する試薬を用いたタンパク質発現の測定
US11667951B2 (en) 2016-10-24 2023-06-06 Geneinfosec, Inc. Concealing information present within nucleic acids
US10822651B2 (en) 2016-10-28 2020-11-03 Grail, Inc. Methods for single-stranded nucleic acid library preparation
AU2017359047A1 (en) 2016-11-08 2019-05-02 Becton, Dickinson And Company Methods for cell label classification
KR20190077062A (ko) 2016-11-08 2019-07-02 셀룰러 리서치, 인크. 발현 프로파일 분류 방법
EP3551768B1 (de) 2016-12-12 2024-03-06 Grail, LLC Verfahren zur markierung und amplifizierung von rna-template-molekülen zur herstellung von sequenzierungsbibliotheken
US10982351B2 (en) 2016-12-23 2021-04-20 Grail, Inc. Methods for high efficiency library preparation using double-stranded adapters
CN110573253B (zh) 2017-01-13 2021-11-02 赛卢拉研究公司 流体通道的亲水涂层
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
WO2018183918A1 (en) 2017-03-30 2018-10-04 Grail, Inc. Enhanced ligation in sequencing library preparation
US11584958B2 (en) 2017-03-31 2023-02-21 Grail, Llc Library preparation and use thereof for sequencing based error correction and/or variant identification
WO2018183897A1 (en) 2017-03-31 2018-10-04 Grail, Inc. Higher target capture efficiency using probe extension
WO2018186947A1 (en) * 2017-04-06 2018-10-11 MyOmicsDx, Inc Method and kit for targeted enrichment of nucleic acids
WO2018186930A1 (en) * 2017-04-06 2018-10-11 MyOmicsDx, Inc Method and kit for constructing nucleic acid library
US10914729B2 (en) 2017-05-22 2021-02-09 The Trustees Of Princeton University Methods for detecting protein binding sequences and tagging nucleic acids
CN110719959B (zh) 2017-06-05 2021-08-06 贝克顿迪金森公司 针对单细胞的样品索引
EP3638786A1 (de) 2017-06-15 2020-04-22 Genome Research Limited Duplex-sequenzierung mit direct-repeat-molekülen
US11180804B2 (en) 2017-07-25 2021-11-23 Massachusetts Institute Of Technology In situ ATAC sequencing
CA3079524A1 (en) 2017-11-03 2019-05-09 Interna Technologies B.V. Mirna molecule, equivalent, antagomir, or source thereof for treating and/or diagnosing a condition and/or a disease associated with neuronal deficiency or for neuronal (re)generation
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
WO2019118925A1 (en) 2017-12-15 2019-06-20 Grail, Inc. Methods for enriching for duplex reads in sequencing and error correction
US11946095B2 (en) 2017-12-19 2024-04-02 Becton, Dickinson And Company Particles associated with oligonucleotides
WO2019126803A1 (en) 2017-12-22 2019-06-27 Grail, Inc. Error removal using improved library preparation methods
EP3553182A1 (de) 2018-04-11 2019-10-16 Université de Bourgogne Verfahren zum nachweis von somatischen genetischen anomalien, kombination von fangsonden und nachweiskit
WO2019213294A1 (en) 2018-05-03 2019-11-07 Becton, Dickinson And Company High throughput multiomics sample analysis
WO2019213237A1 (en) 2018-05-03 2019-11-07 Becton, Dickinson And Company Molecular barcoding on opposite transcript ends
CA3112792A1 (en) 2018-09-14 2020-03-19 Prelude Corporation Method of selection for treatment of subjects at risk of invasive breast cancer
JP2022511398A (ja) 2018-10-01 2022-01-31 ベクトン・ディキンソン・アンド・カンパニー 5’転写物配列の決定
JP2022506546A (ja) 2018-11-08 2022-01-17 ベクトン・ディキンソン・アンド・カンパニー ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析
EP3894593A2 (de) 2018-12-13 2021-10-20 DNA Script Direkte oligonukleotidsynthese auf zellen und biomolekülen
EP3894552A1 (de) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selektive verlängerung in der vollständigen transkriptomanalyse von einzelzellen
US11293061B2 (en) 2018-12-26 2022-04-05 Illumina Cambridge Limited Sequencing methods using nucleotides with 3′ AOM blocking group
CA3124763A1 (en) 2019-01-03 2020-07-09 Dna Script One pot synthesis of sets of oligonucleotides
WO2020150356A1 (en) 2019-01-16 2020-07-23 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
EP4242322A3 (de) 2019-01-23 2023-09-20 Becton, Dickinson and Company Mit antikörpern assoziierte oligonukleotide
WO2020183280A1 (en) 2019-03-14 2020-09-17 Genome Research Limited Method for sequencing a direct repeat
US11421271B2 (en) 2019-03-28 2022-08-23 Illumina Cambridge Limited Methods and compositions for nucleic acid sequencing using photoswitchable labels
WO2020210521A2 (en) 2019-04-12 2020-10-15 The Regents Of The University Of California Compositions and methods for increasing muscle mass and oxidative metabolism
US11939622B2 (en) 2019-07-22 2024-03-26 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
WO2021055306A1 (en) 2019-09-16 2021-03-25 Bristol-Myers Squibb Company Dual capture method for analysis of antibody-drug conjugates
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
EP4150118A1 (de) 2020-05-14 2023-03-22 Becton Dickinson and Company Primer zur profilierung von immunrepertoire
CN115667511A (zh) * 2020-05-15 2023-01-31 科德斯Dna公司 多核苷酸序列的按需合成
US11787831B2 (en) 2020-06-22 2023-10-17 Illumina Cambridge Limited Nucleosides and nucleotides with 3′ acetal blocking group
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
US20220033900A1 (en) 2020-07-28 2022-02-03 Illumina Cambridge Limited Substituted coumarin dyes and uses as fluorescent labels
WO2022029688A1 (en) 2020-08-05 2022-02-10 Inivata Ltd. Highly sensitive method for detecting cancer dna in a sample
EP4247967A1 (de) 2020-11-20 2023-09-27 Becton, Dickinson and Company Profilierung von stark exprimierten und schwach exprimierten proteinen
US20220195517A1 (en) 2020-12-17 2022-06-23 Illumina Cambridge Limited Long stokes shift chromenoquinoline dyes and uses in sequencing applications
US20220195516A1 (en) 2020-12-17 2022-06-23 Illumina Cambridge Limited Methods, systems and compositions for nucleic acid sequencing
US20220195196A1 (en) 2020-12-17 2022-06-23 Illumina Cambridge Limited Alkylpyridinium coumarin dyes and uses in sequencing applications
US20220195518A1 (en) 2020-12-22 2022-06-23 Illumina Cambridge Limited Methods and compositions for nucleic acid sequencing
CA3215598A1 (en) 2021-05-05 2022-11-10 Michael Callingham Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing
IL308173A (en) 2021-05-20 2024-01-01 Illumina Inc Compositions and methods for genetic sequencing by synthesis
EP4355476A1 (de) 2021-06-15 2024-04-24 Illumina, Inc. Hydrogelfreie oberflächenfunktionalisierung zur sequenzierung
US20230116852A1 (en) 2021-07-23 2023-04-13 Illumina, Inc. Methods for preparing substrate surface for dna sequencing
WO2023012521A1 (en) 2021-08-05 2023-02-09 Inivata Limited Highly sensitive method for detecting cancer dna in a sample
WO2023069927A1 (en) 2021-10-20 2023-04-27 Illumina, Inc. Methods for capturing library dna for sequencing
CA3222807A1 (en) 2022-03-22 2023-09-28 Alexandra SZEMJONOV Substrate with orthogonally functional nanodomains
US20230304086A1 (en) 2022-03-28 2023-09-28 Illumina Cambridge Limited Labeled avidin and methods for sequencing
WO2023186819A1 (en) 2022-03-29 2023-10-05 Illumina Cambridge Limited Chromenoquinoline dyes and uses in sequencing
US20230383342A1 (en) 2022-05-31 2023-11-30 Illumina Cambridge Limited Compositions and methods for nucleic acid sequencing
US20230416279A1 (en) 2022-06-28 2023-12-28 Illumina Cambridge Limited Fluorescent dyes containing fused tetracyclic bis-boron heterocycle and uses in sequencing
WO2024003332A1 (en) 2022-06-30 2024-01-04 F. Hoffmann-La Roche Ag Controlling for tagmentation sequencing library insert size using archaeal histone-like proteins
WO2024028794A1 (en) 2022-08-02 2024-02-08 Temple Therapeutics BV Methods for treating endometrial and ovarian hyperproliferative disorders
WO2024039516A1 (en) 2022-08-19 2024-02-22 Illumina, Inc. Third dna base pair site-specific dna detection

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4719179A (en) 1984-11-30 1988-01-12 Pharmacia P-L Biochemicals, Inc. Six base oligonucleotide linkers and methods for their use
US4683202A (en) * 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5210203A (en) 1985-06-25 1993-05-11 Siska Diagnostics, Inc. Sulfonamide-derivative compounds for tagging nucleic acid probes
US5149625A (en) 1987-08-11 1992-09-22 President And Fellows Of Harvard College Multiplex analysis of DNA
GB8810400D0 (en) 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
US5002867A (en) 1988-04-25 1991-03-26 Macevicz Stephen C Nucleic acid sequence determination by multiple mixed oligonucleotide probes
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
WO1990001564A1 (en) 1988-08-09 1990-02-22 Microprobe Corporation Methods for multiple target analyses through nucleic acid hybridization
US5200051A (en) 1988-11-14 1993-04-06 I-Stat Corporation Wholly microfabricated biosensors and process for the manufacture and use thereof
US5856092A (en) 1989-02-13 1999-01-05 Geneco Pty Ltd Detection of a nucleic acid sequence or a change therein
WO1990011372A1 (en) 1989-03-21 1990-10-04 Collaborative Research, Inc. Multiplex dna diagnostic test
DE69028402T2 (de) * 1989-05-22 1997-04-17 Hoffmann La Roche Verfahren zur markierung und zum nachweis von stoffen mit nukleinsäuren
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
GB8920097D0 (en) 1989-09-06 1989-10-18 Ici Plc Amplification processes
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
ES2155822T3 (es) 1990-12-06 2001-06-01 Affymetrix Inc Compuestos y su utilizacion en una estrategia de sintesis binaria.
RU1794088C (ru) 1991-03-18 1993-02-07 Институт Молекулярной Биологии Ан@ Ссср Способ определени нуклеотидной последовательности ДНК и устройство дл его осуществлени
US5412087A (en) 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
DE69233331T3 (de) 1991-11-22 2007-08-30 Affymetrix, Inc., Santa Clara Kombinatorische Strategien zur Polymersynthese
US5981176A (en) 1992-06-17 1999-11-09 City Of Hope Method of detecting and discriminating between nucleic acid sequences
GB9218131D0 (en) 1992-08-26 1992-10-14 Slater James H A method of marking a liquid
WO1994010128A1 (en) 1992-11-02 1994-05-11 Affymax Technologies N.V. Novel photoreactive protecting groups
US5795714A (en) 1992-11-06 1998-08-18 Trustees Of Boston University Method for replicating an array of nucleic acid probes
US5436142A (en) 1992-11-12 1995-07-25 Cold Spring Harbor Laboratory Methods for producing probes capable of distingushing variant genomic sequences
US5340728A (en) * 1992-12-09 1994-08-23 E. I. Du Pont De Nemours And Company Method for amplification of targeted segments of nucleic acid using nested polymerase chain reaction
US5837832A (en) * 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US5426039A (en) 1993-09-08 1995-06-20 Bio-Rad Laboratories, Inc. Direct molecular cloning of primer extended DNA containing an alkane diol
JPH09507121A (ja) 1993-10-26 1997-07-22 アフィマックス テクノロジーズ ナームロゼ ベノートスハップ 生物学的チップ上の核酸プローブアレー
JP3419850B2 (ja) 1993-10-26 2003-06-23 株式会社日立製作所 核酸分別方法
US5429807A (en) 1993-10-28 1995-07-04 Beckman Instruments, Inc. Method and apparatus for creating biopolymer arrays on a solid support surface
GB9401833D0 (en) 1994-02-01 1994-03-30 Isis Innovation Method for discovering ligands
DE69516325T2 (de) 1994-02-22 2001-01-18 Mitsubishi Chem Corp Oligonukleotid und Verfahren zur Analyse der Basensequenz der Nukleinsäure
US5846719A (en) * 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US6280935B1 (en) * 1994-10-13 2001-08-28 Lynx Therapeutics, Inc. Method of detecting the presence or absence of a plurality of target sequences using oligonucleotide tags
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5776737A (en) 1994-12-22 1998-07-07 Visible Genetics Inc. Method and composition for internal identification of samples
JP2000513921A (ja) 1995-03-04 2000-10-24 ベーリンガー マンハイム ゲーエムベーハー 核酸の配列特異的検出
EP2368897B1 (de) 1996-02-09 2016-10-19 Cornell Research Foundation, Inc. Detektion von Unterschieden in der Sequenz von Nukleinsäuren Mittels der Ligasedetektionsreaktion und adressierbaren Anordnungen
EP0912761A4 (de) 1996-05-29 2004-06-09 Cornell Res Foundation Inc Bestimmung von unterschieden in der nukleisäuresequenz mittels einer kombination von ligasebestimmung und polymerase-kettenreaktion
US6312892B1 (en) 1996-07-19 2001-11-06 Cornell Research Foundation, Inc. High fidelity detection of nucleic acid differences by ligase detection reaction
US5888737A (en) 1997-04-15 1999-03-30 Lynx Therapeutics, Inc. Adaptor-based sequence analysis
US6607878B2 (en) * 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
US6265163B1 (en) 1998-01-09 2001-07-24 Lynx Therapeutics, Inc. Solid phase selection of differentially expressed genes
US6537749B2 (en) * 1998-04-03 2003-03-25 Phylos, Inc. Addressable protein arrays
AU6502599A (en) 1998-10-05 2000-04-26 Lynx Therapeutics, Inc. Enzymatic synthesis of oligonucleotide tags
CA2349836A1 (en) 1998-11-02 2000-05-11 Lynx Therapeutics, Inc. Method for making complementary oligonucleotide tag sets

Also Published As

Publication number Publication date
EP1721993A2 (de) 2006-11-15
EP0799897B1 (de) 2006-06-28
US6458530B1 (en) 2002-10-01
ATE331810T1 (de) 2006-07-15
EP0799897A1 (de) 1997-10-08
US20040146901A1 (en) 2004-07-29
US20030104436A1 (en) 2003-06-05
DE69736215D1 (de) 2006-08-10
EP1721993A3 (de) 2007-03-07

Similar Documents

Publication Publication Date Title
DE69736215T2 (de) Verfahren zur Detektion von Zielnukleinsäuren unter Verwendung von Markernukleinsäuren
DE60023539T2 (de) Immunologischer nachweis von rna:dna-hybriden auf mikroarrays
DE60018052T2 (de) Vergleichende fluoreszenz-hybridisierung auf oligonukleotid mikroarrays
DE69929542T2 (de) Komplexitätsmanagement und analyse genomischer dna
DE69839373T2 (de) Auf die Verwendung von nukleaseresistenten Fragmenten basierende Verfahren und Kits, die für Nukleinsäuretests mit hohem Durchsatz geeignet sind
DE60125312T2 (de) Mikroarray
DE60128720T2 (de) Mikroarray-verfahren zur genotypisierung mehrerer proben für mehrere loci
Berchowitz et al. Fluorescent Arabidopsis tetrads: a visual assay for quickly developing large crossover and crossover interference data sets
WO2003020968A2 (de) Verfahren zur analyse von nukleinsäurekettensequenzen und der genexpression
DE69936379T2 (de) Verfahren zur genotypisierung und dna-analyse
WO2004009765A2 (en) Strategies for gene expression analysis
EP1975246A1 (de) Markierungsfreie Sequenzierung auf einer Festphase mittels Feldeffekttransistoren
DE19854946C2 (de) Klonieren und Kopieren an Oberflächen
DE10120798A1 (de) Verfahren zur Bestimmung der Genexpression
DE102010029855B4 (de) Sondenmoleküle für die Fluoreszenz bei der In-Situ-Hybridisierung von Oligonukleotiden (Fish)
DE60038109T2 (de) Verfahren zur Analyse von AFLP Reaktionsmischungen unter Verwendung von Primer Verlängerungstechniken
DE60306328T2 (de) Verfahren zur integrierten Integritätsbewertung und Analyse von Nukleinsäuren
WO2003012135A2 (de) Verfahren zur konfigurierung paralleler nukleinsäureanalyseverfahren zur sequenzmengenklassifikation
DE602004004758T2 (de) Personalisierte Mikroarrays und ihre Verwendung zum Nachweis von Zielmolekülen
DE102004049891B4 (de) Verfahren zum Identifizieren von geeigneten Nukleinsäurenormalisierungssondensequenzen zur Verwendung bei Nukleinsäurearrays
DE10325098B3 (de) Verfahren zur SNP-Analyse auf Biochips mit Oligonukleotid-Arealen
EP1234056B1 (de) Dynamische bestimmung von analyten durch arrays auf inneren oberflächen
Charpe DNA microarray
DE60226230T2 (de) Bestimmungsverfahren für das vorhandensein von verlängerungsprodukten
DE10110685A1 (de) Oligonukleotidchip

Legal Events

Date Code Title Description
8363 Opposition against the patent
8331 Complete revocation