illumina 550Dx Regulated for Molecular Diagnostics User Manual
- June 9, 2024
- illumina
Table of Contents
550Dx Regulated for Molecular Diagnostics
Germline Variant-analysemodule in Local Run Manager
Workflowhandleiding voor NextSeq 550Dx
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Overzicht
3
Runinformatie invoeren
4
Analysemethoden
6
Run- en monstergegevens weergeven
7
Analysis Report (Analyserapport)
8
Uitvoerbestanden van analyse
9
Revisiegeschiedenis
16
Technische ondersteuning
17
Documentnr. 1000000030329 v04 NLD Augustus 2021 BESTEMD VOOR IN- VITRODIAGNOSTIEK
BEDRIJFSEIGENDOM VAN ILLUMINA
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager
voor NextSeq 550Dx
Dit document en de inhoud ervan zijn eigendom van Illumina, Inc. en haar
dochterondernemingen (‘Illumina’), en zijn alleen bedoeld voor contractueel
gebruik door haar klanten in verband met het gebruik van de hierin beschreven
producten en voor geen enkel ander doel. Dit document en de inhoud ervan mogen
niet worden gebruikt of gedistribueerd voor welk ander doel dan ook en/of op
een andere manier worden gecommuniceerd, geopenbaard of gereproduceerd zonder
de voorafgaande schriftelijke toestemming van Illumina. Illumina geeft door
middel van dit document geen licenties onder haar patent, handelsmerk,
auteursrecht of gewoonterechten noch soortgelijke rechten van derden door. De
instructies in dit document moeten strikt en uitdrukkelijk worden opgevolgd
door gekwalificeerd en voldoende opgeleid personeel om een correct en veilig
gebruik van de hierin beschreven producten te waarborgen. Alle inhoud van dit
document moet volledig worden gelezen en begrepen voordat dergelijke producten
worden gebruikt. HET NIET VOLLEDIG LEZEN EN UITDRUKKELIJK OPVOLGEN VAN ALLE
INSTRUCTIES IN DIT DOCUMENT KAN RESULTEREN IN SCHADE AAN DE PRODUCTEN, LETSEL
AAN PERSONEN (INCLUSIEF GEBRUIKERS OF ANDEREN) EN SCHADE AAN ANDERE
EIGENDOMMEN. BIJ HET NIET VOLLEDIG LEZEN EN UITDRUKKELIJK OPVOLGEN VAN ALLE
INSTRUCTIES IN DIT DOCUMENT VERVALLEN ALLE GARANTIES DIE VAN TOEPASSING ZIJN
OP HET PRODUCT. ILLUMINA IS OP GEEN ENKELE MANIER AANSPRAKELIJK VOOR GEVOLGEN
VAN EEN ONJUIST GEBRUIK VAN DE PRODUCTEN DIE HIERIN WORDEN BESCHREVEN
(INCLUSIEF DELEN DAARVAN OF SOFTWARE). © 2021 Illumina, Inc. Alle rechten
voorbehouden. Alle handelsmerken zijn het eigendom van Illumina, Inc. of hun
respectievelijke eigenaren. Ga naar www.illumina.com/company/legal.html voor
meer informatie over specifieke handelsmerken.
Documentnr. 1000000030329 v04 NLD
2
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager
voor NextSeq 550Dx
Overzicht
De Germline Variant-module in Local Run Manager is bedoeld voor gebruik met de
Illumina TruSeq Custom Amplicon Kit Dx assay en de NextSeq 550Dx. Indien
gebruikt met de Germline Variant-module, is de test bedoeld voor het
voorbereiden van bibliotheken die worden gebruikt voor sequencing van DNA uit
perifere volbloedmonsters. De analysemodule controleert korte regio’s van
geamplificeerd DNA, of amplicons, op varianten. Door gerichte sequencing van
amplicons is een hoge dekking van bepaalde gebieden mogelijk. Raadpleeg de
bijsluiter TruSeq Custom Amplicon Kit Dx (documentnr. 1000000029772). De
Germline Variant-analysemodule vereist verbruiksgoederen voor sequencing van
300 cycli. Raadpleeg voor meer informatie de bijsluiter NextSeq 550Dx High
Output Reagent Kit v2 of NextSeq 550Dx High Output Reagent Kit v2.5.
Toelichting op deze handleiding
In deze handleiding vindt u instructies voor het instellen van runparameters
voor sequencing en analyse voor de Germline Variant-analysemodule. Zie de
NextSeq 550Dx-instrumenthandleiding (documentnr. 1000000009513) voor meer
informatie over het dashboard en de systeeminstellingen van Local Run Manager.
Local Run Manager weergeven
De interface van Local Run Manager kan worden weergegeven in NextSeq 550Dx
Operating Software (NOS) of met een webbrowser. De ondersteunde webbrowser is
Chromium.
OPMERKING Als u een niet-ondersteunde browser gebruikt, moet u de ondersteunde
browser downloaden wanneer dat wordt gevraagd bij het bericht ‘Confirm
Unsupported Browser’ (Niet-ondersteunde browser bevestigen). Selecteer hier om
de ondersteunde versie van Chromium te downloaden.
Weergeven op de instrumentmonitor
1 Als u de interface van Local Run Manager op de instrumentmonitor wilt
weergeven, selecteert u een van de volgende opties: u Selecteer op de NOS-
startpagina de optie Local Run Manager. Klik op de X in de rechterbovenhoek om
terug te keren naar NOS wanneer u klaar bent. u Selecteer het pictogram NOS
minimaliseren, open de Chromium-webbrowser die op het instrument staat en voer
http://localhost in de adresbalk in. Alleen admin users (beheerders) kunnen
NOS minimaliseren.
Weergeven vanaf een netwerkcomputer
1 Open een Chromium-webbrowser op een computer met toegang tot hetzelfde
netwerk als het instrument en maak verbinding met behulp van het IP-adres of
de naam van het instrument. Bijvoorbeeld: http://myinstrument.
Documentnr. 1000000030329 v04 NLD
3
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
Runinformatie invoeren
Parameters instellen
1 Log in bij Local Run Manager.
2 Selecteer Create Run (Run aanmaken) en selecteer Germline Variant (Kiemlijn-
variant).
3 Voer een runnaam in die de run van de sequencing tot en met de analyse
identificeert. Gebruik alfanumerieke tekens, spaties, onderstrepingstekens of
streepjes.
4 [Optioneel] Voer een runbeschrijving in om de run te kunnen identificeren.
Gebruik alfanumerieke tekens, spaties, onderstrepingstekens of streepjes.
5 Selecteer het aantal monsters en de indexset in de vervolgkeuzelijst.
Overweeg de volgende informatie wanneer u een keuze maakt.
u De vervolgkeuzelijst bevat hoeveelheden van monsters met een indexset.
Bijvoorbeeld: 24-Set 1 geeft aan dat er 24 monsters moeten worden getest, met
indexen uit Indexset 1.
u De nummers van de indexsets verwijzen naar verschillende sets met
i5-indexen. Set 1 en set 2 bieden allebei indexdiversiteit. Er worden twee
indexsets aangeboden om uitputting van een enkele set te voorkomen.
u Kies het aantal monsters dat het dichtst ligt bij het aantal monsters dat u
gaat testen. Als het exacte aantal monsters niet in de lijst staat, selecteert
u het aantal dat het dichtst bij is, maar minder dan het aantal dat u gaat
testen. Als u bijvoorbeeld 18 monsters wilt testen, selecteert u 16 monsters.
u Monsterputjes en indexcombinaties die aan de eisen voor indexdiversiteit
voldoen, zijn groen gemarkeerd. Als u andere putjes en indexcombinaties
selecteert, krijgt u bij het opslaan van de run een melding als niet aan de
vereisten voor indexdiversiteit is voldaan.
Manifestbestanden voor de run importeren
1 Zorg ervoor dat de manifesten die u wilt importeren beschikbaar zijn op een
toegankelijke netwerklocatie of op een USB-stick.
2 Selecteer Import Manifests (Manifesten importeren).
3 Blader naar het manifestbestand en selecteer de manifesten die u wilt
toevoegen.
OPMERKING Als u manifestbestanden beschikbaar wilt maken voor alle runs die de
Germline Variant-analysemodule gebruiken, voegt u manifesten toe via de
module-instellingen. Voor deze functie zijn machtigingen op beheerdersniveau
vereist. Raadpleeg voor meer informatie de NextSeq 550Dx-instrumenthandleiding
(documentnr. 1000000009513).
Monsters voor de run specificeren
Geef monsters op voor de run via een van de opties en de bijbehorende
instructies. u Enter samples manually (Monsters handmatig invoeren): gebruik
de lege tabel in het scherm ‘Create Run’
(Run aanmaken). u Import samples (Monsters importeren): navigeer naar een
extern bestand met een kommagescheiden
(*.csv) indeling. In het scherm ‘Create Run’ (Run aanmaken) kan een sjabloon
worden gedownload.
Documentnr. 1000000030329 v04 NLD
4
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager
voor NextSeq 550Dx
Nadat u de monstertabel hebt gevuld, kunt u de monsterinformatie naar een
extern bestand exporteren. Gebruik het bestand als referentie wanneer u
bibliotheken voorbereidt of importeer het bestand voor een andere run.
Monsters handmatig invoeren
1 Voer in het veld Sample ID (Monster-ID) een unieke identificatie voor het
monster in. Gebruik alfanumerieke tekens, streepjes of onderstrepingstekens.
2 [Optioneel] Klik voor positieve of negatieve controlemonsters met de
rechtermuisknop en selecteer het controletype.
3 [Optioneel] Voer een monsteromschrijving in het veld Sample Description
(Monsterbeschrijving) in. Gebruik alfanumerieke tekens, streepjes of
onderstrepingstekens. Monsteromschrijvingen zijn gekoppeld aan een
monsternaam. Monsteromschrijvingen worden overschreven als dezelfde
monsternaam in een latere run opnieuw wordt gebruikt.
4 Selecteer een Index 1-adapter uit de vervolgkeuzelijst Index 1 (i7). Wanneer
u voorgestelde monsterputjes gebruikt, vult de software automatisch i7- en
i5-indexadapters in die voldoen aan de vereisten voor indexdiversiteit. Als
het exacte aantal monsters dat u wilt testen niet in de lijst staat, moet u
indexadapters voor extra putjes selecteren. Als u indexen moet kiezen voor
extra putjes of als u niet de aanbevolen combinaties van indexadapters
gebruikt, moet u, voordat u indexen kiest, eerst Basebepaling en
indexdiversiteit op pagina 15.
5 Selecteer een Index 2-adapter uit de vervolgkeuzelijst Index 2 (i5).
6 Selecteer een manifestbestand in de vervolgkeuzelijst Manifest.
7 Kies een optie om de plaatindeling te bekijken, af te drukken of op te slaan
als referentie voor het prepareren van bibliotheken: u Selecteer het pictogram
Print (Afdrukken) om de indeling van de plaat weer te geven. Selecteer Print
(Afdrukken) om de plaatindeling af te drukken. u Selecteer Export (Exporteren)
om monsterinformatie naar een extern bestand te exporteren. Controleer of de
gegevens van het manifest en de monsters correct zijn. Onjuiste informatie kan
de resultaten beïnvloeden.
8 Selecteer Save Run (Run opslaan).
Monsters importeren
1 Selecteer Import Samples (Monsters importeren) en blader naar de locatie van
het monsterinformatiebestand. U kunt twee soorten bestanden importeren. u
Selecteer Template (Sjabloon) in het scherm ‘Create Run’ (Run aanmaken) om een
nieuwe plaatindeling te maken. Het sjabloonbestand bevat de juiste kolomkoppen
voor importeren. Voer in elke kolom monsterinformatie in voor de monsters in
de run. Verwijder voorbeeldinformatie in ongebruikte cellen en sla het bestand
op. u Gebruik een bestand met monsterinformatie dat is geëxporteerd uit de
Germline Variant-module met de exporteerfunctie.
2 Selecteer het pictogram Print (Afdrukken) om de indeling van de plaat weer
te geven.
3 Selecteer Print (Afdrukken) om de indeling van de plaat af te drukken als
referentie voor het voorbereiden van bibliotheken.
Documentnr. 1000000030329 v04 NLD
5
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager
voor NextSeq 550Dx
4 [Optioneel] Selecteer Export (Exporteren) om monsterinformatie naar een
extern bestand te exporteren. Controleer of de gegevens van het manifest en de
monsters correct zijn. Onjuiste informatie kan de resultaten beïnvloeden.
5 Selecteer Save Run (Run opslaan).
Een run bewerken
Raadpleeg voor instructies voor het bewerken van de informatie in uw run
voordat u een sequencing start de NextSeq 550Dx-instrumenthandleiding
(documentnr. 1000000009513).
Analysemethoden
De Germline Variant-analysemodule voert de volgende analysestappen uit en
schrijft de uitvoerbestanden van de analyse naar de map Alignment. u Voert
demultiplexen van indexbepalingen uit u Genereert FASTQ-bestanden u Lijnt uit
op een referentie u Identificeert varianten
Demultiplexen
Met demultiplexen wordt elke indexbepalingssequentie met de voor de run
opgegeven indexsequenties vergeleken. In deze stap worden geen
kwaliteitswaarden overgenomen. Indexbepalingen worden geïdentificeerd aan de
hand van de volgende stappen: u De monsternummering begint bij 1 in de
volgorde waarin ze in de run zijn opgenomen. u Monsternummer 0 is gereserveerd
voor clusters die niet aan een monster zijn toegewezen. u Clusters worden
toegewezen aan een monster wanneer de indexsequentie exact overeenkomt of
wanneer er maximaal één discrepantie per indexbepaling is.
FASTQ-bestand genereren
Na het demultiplexen genereert de software tussenliggende analysebestanden in
de FASTQbestandsindeling, wat een tekstindeling is die wordt gebruikt om
sequenties weer te geven. FASTQbestanden bevatten bepalingen voor elk monster
en de bijbehorende kwaliteitsscores. Clusters die niet door het filter zijn
gekomen, worden uitgesloten. Elk FASTQ-bestand bevat bepalingen van slechts
één monster. De naam van dat monster is opgenomen in de FASTQ-bestandsnaam.
FASTQ-bestanden zijn de primaire invoer voor uitlijning. Per monster worden er
acht FASTQ-bestanden gegenereerd : vier uit Bepaling 1 en vier uit Bepaling 2.
Uitlijning
Tijdens de uitlijningsstap lijnt het gebandeerde Smith-Waterman-algoritme
clusters van elk monster uit met amplicon-sequenties die in het
manifestbestand zijn opgegeven. Het gebandeerde Smith-Waterman-algoritme voert
semiglobale sequentie-uitlijningen uit om gelijksoortige gebieden tussen twee
sequenties te bepalen. In plaats van de totale sequentie te vergelijken,
vergelijkt het Smith-Waterman-algoritme segmenten van alle mogelijke lengtes.
Documentnr. 1000000030329 v04 NLD
6
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
Elke paired-end-bepaling wordt geëvalueerd wat betreft uitlijning met de
relevante probesequenties voor die bepaling. u Bepaling 1 wordt geëvalueerd
aan de hand van de omgekeerde aanvulling van de Downstream Locus-
Specific Oligos (DLSO). u Bepaling 2 wordt geëvalueerd aan de hand van de
Upstream Locus-Specific Oligos (ULSO). u Indien het begin van een afgelezen
waarde overeenkomt met een probesequentie en niet meer dan drie
verschillen bevat (discrepanties of verschuivingen door leidende indels),
wordt de volledige lengte van de afgelezen waarde uitgelijnd met het
amplicondoel voor die sequentie. u Gegeven de chemie van de assay worden
indels binnen de DLSO en ULSO niet waargenomen. Uitlijningen worden uit
uitlijningsresultaten gefilterd op basis van discrepantiepercentages over
ofwel het gebied van belang ofwel het volledige amplicon, afhankelijk van de
lengte van het amplicon. Gefilterde uitlijningen worden in
uitlijningsbestanden weggeschreven als niet-uitgelijnd en worden niet gebruikt
bij het aanroepen van varianten.
Variantbepaling
De Pisces-variantbepaler, die is ontwikkeld door Illumina, identificeert
varianten die in het DNA-monster voorkomen. De Pisces-variantbepaler
identificeert SNV’s, MNV’s en kleine indels in drie stappen: u Overweegt elke
positie in het referentiegenoom afzonderlijk u Telt basen op de gegeven
positie voor uitgelijnde bepalingen die de positie overlappen u Berekent een
variantscore die de kwaliteit van de bepaling meet met behulp van het Poisson-
model.
Varianten met een kwaliteitsscore lager dan Q20 worden uitgesloten. Als een
variant door alle filters heenkomt, wordt de variant gemarkeerd as PASS
(Geslaagd) in VCF. Zie github.com/Illumina/Pisces/wiki voor meer informatie.
Run- en monstergegevens weergeven
1 Klik in het dashboard van Local Run Manager op de runnaam.
2 Bekijk op het tabblad Run Overview (Runoverzicht) de metrische gegevens van
de sequencing-run.
3 [Optioneel] Klik op het pictogram Copy to Clipboard (Naar klembord kopiëren)
om het pad naar de uitvoermap voor de run te kopiëren.
4 Klik op het tabblad Sequencing Information (Sequencinginformatie) om de
runparameters en de informatie over de verbruiksartikelen te bekijken.
5 Klik op het tabblad Samples and Results (Monsters en resultaten) om de
locatie van het analyserapport weer te geven. u Als de analyse is herhaald,
opent u het vervolgkeuzemenu Select Analysis (Analyse selecteren) en
selecteert u de juiste analyse.
6 Klik op het pictogram Copy to Clipboard (Naar klembord kopiëren) om het pad
naar de analysemap te kopiëren.
Raadpleeg voor meer informatie over de tabbladen Run Overview (Runoverzicht)
en Sequencing Information (Sequencinginformatie), en hoe u een analyse opnieuw
kunt uitvoeren, de NextSeq 550Dxinstrumenthandleiding (documentnr.
1000000009513).
Documentnr. 1000000030329 v04 NLD
7
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
Analysis Report (Analyserapport)
De analyseresultaten staan in een samenvatting op het tabblad Samples and
Results (Monsters en resultaten) en in een samenvattend rapport in de map
Alignment (Uitlijning). Voor elk monster is ook een rapport in PDF-indeling
beschikbaar.
Informatie op het tabblad Samples and Results (Monsters en resultaten)
1 Klik op een monster in de lijst om het monsterrapport te openen.
Tabel 1 Informatie over run en monster
Kol omk op
Omschrijving
Run Status (Runstatus)
Geeft aan of de sequencing-run geslaagd of mislukt is.
Total Yield (GB) (Totaal resultaat (GB))
Aantal basen die in de sequencing-run zijn bepaald. Toont de drempelwaarde en de status geslaagd of mislukt.
% Q30
Het percentage bepalingen in de sequencing-run met een kwaliteitsscore van 30 (Q30) of hoger. Toont de drempelwaarde en de status geslaagd of mislukt.
Sample ID (Monster-ID)
Total PF Reads (Totaal PFbepalingen)
Read 1% Q30 (Bepaling 1% Q30)
Read 2% Q30 (Bepaling 2% Q30)
Autosome Call Rate (Bepalingspercentage van autosomen)
De monster-ID die bij het aanmaken van de run is opgegeven.
Het totale aantal bepalingen dat door het filter komt.
Het percentage bepalingen in Bepaling 1 met een kwaliteitsscore van 30 (Q30)
of hoger voor het monster.
Het percentage bepalingen in Bepaling 2 met een kwaliteitsscore van 30 (Q30)
of hoger voor het monster.
Het aantal genomische posities in de autosomen (chromosomen 1 tot en met 22)
dat aan een vooraf bepaalde drempelwaarde voor de betrouwbaarheidsgraad
voldoet, gedeeld door het totale aantal onderzochte autosomale genomische
posities. Het bepalingspercentage wordt per monster beschreven en
gerapporteerd als 1 min (het aantal autosomale posities met onvolledige
bepalingen gedeeld door het totale aantal autosomale posities waarvan de
sequentie is bepaald).
Tabel 2 Informatie in monsterrapport
Kol omk op
Omschrijving
Monster
De monster-ID die bij het aanmaken van de run is opgegeven.
Report Date (Rapportdatum)
Datum waarop het rapport werd gegenereerd.
Sample Information ( M on ste rin f orm a tie )
De monster-ID die werd opgegeven bij het aanmaken van de run, het totaal aantal bepalingen die door de filter in het monster zijn gekomen, het bepalingspercentage voor het monster met een kwaliteitsscore van 30 (Q30) of hoger en het autosomale be pa lin gspe rc e n ta ge .
Amplicon Summary (Ampliconsamenvatting)
Totaal aantal gesequencete amplicongebieden en de totale lengte in basenparen van gesequencete amplicons in de doelgebieden, voor het monster en het manifestbestand. Het manifestbestand specificeert het referentiegenoom en de doelreferentiegebieden die in de uitlijningsstap worden gebruikt.
Read Level Statistics (Statistieken Aantal en percentage van bepalingen voor het monster die elke positie in de
van bepalingsniveaus)
referentie dekken voor Bepaling 1 en Bepaling 2.
Variants Summary (Overzicht van va ria n te n )
Aantal gedetecteerde SNV’s, invoegingen en verwijderingen voor het monster dat voldoet aan de voorgestelde waarden om te bepalen of de kwaliteitsresultaten binnen een aanvaardbaar bereik liggen.
Documentnr. 1000000030329 v04 NLD
8
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
Kol omk op Coverage Summary ( De kkin gssa m e n va ttin g)
Coverage Plots ( De kkin gsdia gra m m e n )
Software Versions ( S of tw a re ve rsie s)
Omschrijving
Het totale aantal uitgelijnde basen gedeeld door de grootte van het doelgebied
en het percentage amplicongebieden met dekkingswaarden die groter zijn dan de
lage dekkingsdrempel van 0,2 * amplicon gemiddelde dekking voor het monster.
De grafiek Coverage by Amplicon Region (Dekking per amplicongebied) toont de
dekking binnen de amplicongebieden voor het monster. Gebieden met
dekkingswaarden die lager zijn dan de dekkingsdrempel, zijn rood gemarkeerd.
Het gemiddelde van alle waarden wordt aangegeven door een oranje lijn.
Softwareversies toen het monster werd gesequencet. Omvat de NextSeq 550Dx
Operating Software (NOS), de Local Run Manager-software, de RTA-software en de
Germline Variant-moduleversie.
Uitvoerbestanden van analyse
De volgende uitvoerbestanden van de analyse worden gegenereerd voor de
Germline Variant-analysemodule en bevatten analyseresultaten voor uitlijning
en bepaling van varianten. De uitvoerbestanden van de analyse bevinden zich in
de map Alignment.
Bestandsnaam Demultiplexen (.txt) FASTQ (.fastq.gz)
Uitlijningsbestanden in de BAMbestandsindeling (.bam)
Variantbepalingsbestanden met genome VCF-indeling (.genome.v cf.gz)
Variantbepalingsbestanden met VCF-bestandsindeling (*.vcf.gz) Amp l i conC ov
er age_M1.t s v
Omschrijving Tussenliggende bestanden met samenvattende demultiplexresultaten.
Tussenliggende bestanden die basepalingen met kwaliteitsscores bevatten.
FASTQ-bestanden zijn de primaire invoer voor de uitlijningsstap. Bevat
uitgelijnde bepalingen voor een bepaald monster.
Bevat het genotype voor elke positie, of het nu als variant of als referentie
wordt aangeroepen.
Bevat alle bepaalde varianten in de doelregio.
Bevat informatie over de dekking per amplicon en per monster voor elk
verstrekt manifest. M# staat voor het manifestnummer.
Bestandsindeling voor demultiplexen
Bij demultiplexen wordt de aan elk cluster gekoppelde indexsequentie gelezen
om te bepalen van welk monster het cluster afkomstig is. De toewijzing van
clusters aan monsternummers wordt weggeschreven naar een demultiplexbestand
(*.demux) voor elke tegel van de stroomcel. De naamgeving van het
demultiplexbestand is s_1_X.demux, waarbij X het nummer van de tegel is.
Demultiplexbestanden beginnen met een kopregel: u Versie (geheel getal van 4
bytes), momenteel 1 u Clustertelling (geheel getal van 4 bytes) De rest van
het bestand bestaat uit monsternummers voor elk cluster uit de tegel. Wanneer
het demultiplexen is voltooid, genereert de software een demultiplexbestand
met de naam DemultiplexSummaryF1L1.txt. u In de bestandsnaam staat F1 voor het
stroomcelnummer. u In de bestandsnaam staat L1 voor het baannummer. u
Demultiplexen resulteert in een tabel met 1 rij per tegel en 1 kolom per
monster, inclusief monster 0.
Documentnr. 1000000030329 v04 NLD
9
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager
voor NextSeq 550Dx
u De meest voorkomende sequenties in indexbepalingen.
FASTQ-bestandsindeling
FASTQ is een tekstbestandsindeling die basepalingen en kwaliteitswaarden per
bepaling bevat. Elke record bevat 4 regels: u De identificatie u De sequentie
u Een plusteken (+) u De Phred-kwaliteitsscores in een ASCII + 33-indeling De
identifier is als volgt ingedeeld: @Instrument:RunID:FlowCellID:Lane:Tile:X:Y
ReadNum:FilterFlag:0:SampleNumber Voorbeeld:
@SIM:1:FCX:1:15:6329:1045 1:N:0:2 TCGCACTCAACGCCCTGCATATGACAAGACAGAATC +
Documentnr. 1000000030329 v04 NLD
10
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
VCF-bestandsindeling
Variant Call Format (VCF) is een veelgebruikte bestandsindeling die is
ontwikkeld door de wetenschappelijke genomicagemeenschap. VCF-bestanden
bevatten informatie over varianten die op specifieke posities in een
referentiegenoom worden aangetroffen. VCF-bestanden eindigen op het
achtervoegsel .vcf
De kopregel van het VCF-bestand bevat de versie van de VCF-bestandsindeling en
de versie van de variantbepaler en vermeldt de annotaties die in de rest van
het bestand worden gebruikt. De VCF-kopregel vermeldt ook het
referentiegenoombestand en het BAM-bestand. De laatste regel in de kopregel
bevat de kolomtitels voor de gegevensregels. Alle gegevensregels van het VCF-
bestand bevatten informatie over één variant.
VC-bestandskopregels
Kop r egel CHROM POS ID
REF ALT
QUAL
Omschrijving
Het chromosoom van het referentiegenoom. Chromosomen verschijnen in dezelfde
volgorde als het FASTQ-referentiebestand.
De enkele basepositie van de variant in het referentiechromosoom. Voor SNP’s
is deze positie de referentiebasis met de variant. Voor indels of
verwijderingen is deze positie de referentiebasis onmiddellijk vóór de
variant.
Het rs-nummer voor de variant verkregen uit dbSNP.txt, indien van toepassing.
Als er meerdere rs-nummers op deze locatie staan, worden ze in de lijst door
puntkomma’s gescheiden. Als op deze positie geen dbSNP-gegeven bestaat, wordt
een markering voor ontbrekende waarde (‘.’) ge bru ikt.
Het referentiegenotype. Zo wordt een verwijdering van één T weergegeven als
referentie-TT en alternatieve T. Een A-naar-T-variant van één nucleotide wordt
weergegeven als referentie A en alternatieve T.
De allelen die verschillen van de referentiebepaling. Bijvoorbeeld, een
invoeging van een enkele T wordt weergegeven als referentie A en alternatieve
AT. Een A-naar-T-variant van één nucleotide wordt weergegeven als referentie A
en alternatieve T.
Een kwaliteitsscore op de Phred-schaal die is toegekend door de
variantbepaler. Hogere scores wijzen op een groter vertrouwen in de variant en
een lagere score op de waarschijnlijkheid van aanwezige fouten. Voor een
kwaliteitsscore van Q is de geschatte kans op een fout 10-(Q/10). De reeks
Q30-bepalingen heeft bijvoorbeeld een foutenpercentage van 0,1%. Veel
variantbepalers kennen kwaliteitsscores toe op basis van hun statistische
modellen, die hoog zijn in verhouding tot het waargenomen foutenpercentage.
Documentnr. 1000000030329 v04 NLD
11
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
VCF-bestandsannotaties
Kop r egel FILTER (Filter) INFO (Informatie)
FORMAT (Indeling)
SAMPLE (Monster)
Omschrijving
Als aan alle filters is voldaan, wordt PASS in de filterkolom geschreven. ·
LowDP: Toegepast op locaties met een dekkingsdiepte van minder dan 150 x. Voor
ampliconposities die zowel door de voorwaartse als door de achterwaartse
bepaling worden gedekt, komt dit overeen met een dekking van 300 paired-end-
bepalingen. · q20: Kwaliteitsscore < 20. · MultiAllelicSite–Variant voldoet
niet aan het diploïde model. · R5x9: Het aantal aangrenzende herhalingen (van
lengte 1 tot 5 bp) op de variantbepalingen 9. · SB: De systematische fout van
de streng is groter dan de bepaalde drempel.
Mogelijke vermeldingen in de kolom INFO zijn: · AC: Aantal allelen in
genotypen voor elk ALT-allel, in dezelfde volgorde als vermeld. · AF:
Allelfrequentie voor elk ALT-allel, in dezelfde volgorde als vermeld. · AN:
Het totale aantal allelen in de genoemde genotypen. · CD: Een vlag die
aangeeft dat de SNP voorkomt in het coderende gebied van ten minste 1
Re f G e n e -ve rm e ldin g. · DP: De diepte (aantal basepalingen uitgelijnd
op een positie en gebruikt bij het bepalen van
va ria n te n ) . · Exon: Een door komma’s gescheiden lijst van exongebieden
die uit RefGene zijn gelezen. · FC: Functioneel gevolg. · GI: Een door komma’s
gescheiden lijst van gen-ID’s die uit RefGene zijn gelezen. · QD:
Variantvertrouwen/kwaliteit per diepte. · TI: Een door komma’s gescheiden
lijst van transcript-ID’s die uit RefGene zijn gelezen.
In de indelingskolom staan de velden gescheiden door dubbele punten.
Bijvoorbeeld: GT:GQ. De lijst van verstrekte velden hangt af van de gebruikte
variantbepaler. Beschikbare velden zijn: · AD: Invoer van de vorm X, Y,
waarbij X het aantal referentiebepalingen is en Y het aantal
alternatieve bepalingen. · DP: Geschatte bepalingsdiepte; bepalingen met
MQ=255 of met slechte paren worden
ge f ilte rd. · GQ: Kwaliteit van het genotype. · GT: Genotype. 0 komt overeen
met de referentiebase, 1 komt overeen met de eerste
vermelding in de kolom ALT, enz. De schuine streep (/) geeft aan dat er geen
faseringsinformatie beschikbaar is. · NC: Fractie van basen die niet zijn
bepaald, of met een basebepalingskwaliteit beneden de m in im u m dre m pe l.
· NL: Ruisniveau; een schatting van de basebepalingsruis op deze positie. ·
SB: Systematische fout van streng op deze positie. Grotere negatieve waarden
wijzen op minder systematische fouten. Waarden dicht bij 0 wijzen op meer
systematische fouten. · VF: Variantfrequentie; het bepalingspercentage dat het
alternatieve allel ondersteunt.
In de kolom Sample (Monster) staan de waarden die in de kolom FORMAT
(Indeling) zijn opgegeven.
Genome VCF-bestanden
Genome VCF-bestanden (gVCF) zijn VCF v4.1-bestanden die een reeks conventies
volgen om alle locaties binnen het genoom in een redelijk compact formaat weer
te geven. De gVCF-bestanden (*.genome.vcf.gz) bevatten alle locaties binnen de
betrokken regio in één bestand voor elk monster.
Het gVCF-bestand toont niet-bepalingen op posities die niet door alle filters
komen. De genotypetag (GT) ./. geeft een niet-bepaling aan.
Zie voor meer informatie sites.google.com/site/gvcftools/home/about-gvcf.
Documentnr. 1000000030329 v04 NLD
12
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
Bestand met amplicon-dekking
Voor elk manifestbestand wordt een bestand met amplicon-dekking gegenereerd.
Het M-nummer in de bestandsnaam staat voor het manifestnummer.
Elk bestand bevat een kopregelrij met de monster-ID’s die bij het manifest
horen. Het bestand bevat de volgende informatie.
u De doel-ID zoals die in het manifest staat vermeld.
u De dekkingsdiepte van bepalingen die door het filter komen.
Aanvullende uitvoerbestanden
De volgende uitvoerbestanden bevatten aanvullende informatie of een
samenvatting van de runresultaten en analysefouten. Hoewel deze bestanden niet
nodig zijn voor de beoordeling van de analyseresultaten, kunnen ze worden
gebruikt voor het oplossen van problemen. Alle bestanden bevinden zich in de
map Alignment, tenzij anders aangegeven.
Bestandsnaam Anal y s i s Log.t x t Anal y s i s E r r or .t x t D emul t i p l ex S ummar y F1L1#.t x t Amp l i conR unS t at i s t i cs .x ml
Omschrijving
Verwerkingslogboek waarin elke stap wordt beschreven die is uitgevoerd tijdens
de analyse van de huidige runmap. Dit bestand bevat geen foutmeldingen.
Bevindt zich in de map Alignment.
Verwerkingslogboek waarin een lijst is opgenomen van eventuele fouten die
tijdens de analyse zijn opgetreden. Dit bestand is leeg als er geen fouten
zijn opgetreden. Bevindt zich in de map Alignment.
Rapporteert demultiplexresultaten in een tabel met 1 rij per tegel en 1 kolom
per monster. Het # staat voor baan 1, 2, 3 of 4 van de stroomcel. Bevindt zich
in de map Alignment.
Bevat samenvattende statistieken die specifiek zijn voor de run. Bevindt zich
in de map Alignment.
Analysemap
De analysemap bevat de bestanden die worden gegenereerd door de Local Run
Manager-software. De relatie tussen de uitvoer- en de analysemap kan als volgt
worden samengevat: u Tijdens de sequencing vult Real-Time Analysis (RTA) de
uitvoermap met bestanden die tijdens de
beeldanalyse, basebepaling en kwaliteitsscore zijn gegenereerd. u RTA kopieert
bestanden in realtime naar de analysemap. Nadat RTA een kwaliteitsscore heeft
toegekend aan elke basis voor elke cyclus, schrijft de software het bestand
RTAComplete.txt naar beide mappen. u Wanneer het bestand RTAComplete.txt
aanwezig is, begint de analyse. u Terwijl de analyse wordt voortgezet,
schrijft Local Run Manager uitvoerbestanden naar de analysemap en kopieert de
bestanden terug naar de uitvoermap.
Uitlijningsmappen
Telkens wanneer die analyse wordt opgevraagd, maakt de Local Run Manager een
uitlijningsmap aan met de naam Alignment_N, waarbij N een volgnummer is.
Documentnr. 1000000030329 v04 NLD
13
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
Mapstructuur
Alignment: bevat .bam-, .vcf-, FASTQ-bestanden en bestanden die specifiek
zijn voor de analysemodule.
Date and Time Stamp: datum- en tijdstempel van analyse als JJJJMMDD_UUMMSS
AnalysisError.txt AnalysisLog.txt aggregate.report.html aggregate.report.pdf
aggregate.summary.csv AmpliconCoverage_M#.tsv AmpliconRunStatistics.xml
Sample1.genome.vcf.gz Sample1.coverage.csv Sample1.report.pdf
Sample1.summary.csv Sample1.vcf.gz Sample1.bam FASTQ Sample1
Sample1_L001_R1_001_fastq.gz Stats DemuxSummaryF1L1.txt FastqSummaryF1L1.txt
Data Intensities BaseCalls L001: bevat .bcl-bestanden. L001: bevat .locs-
bestanden. RTA Logs: bevat logboekbestanden van de RTA-softwareanalyse.
InterOp: bevat binaire bestanden die worden gebruikt om metrische gegevens van
de sequencing-run te rapporteren.
Logs: bevat logboekbestanden waarin de stappen worden beschreven die zijn
uitgevoerd tijdens de sequencing.
RTAComplete.txt RunInfo.xml
Documentnr. 1000000030329 v04 NLD
14
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager
voor NextSeq 550Dx
RunParameters.xml
Basebepaling en indexdiversiteit
Wanneer monsters worden gesequencet op het NextSeq 550Dx-instrument, wordt
door basebepaling een base bepaald (A, C, G of T) voor elk cluster van een
bepaalde tegel of beeldvormingsgebied op de stroomcel, bij een specifieke
cyclus. Het NextSeq 550Dx-instrument maakt gebruik van sequencing met twee
kanalen, waardoor slechts twee beelden nodig zijn om de gegevens voor vier
DNA-basen te coderen, één van het rode kanaal en één van het groene kanaal. De
procedure voor basebepaling-indexbepalingen is anders dan voor basebepaling
tijdens andere bepalingen. Indexbepalingen moeten beginnen met ten minste één
base anders dan G in één van de eerste twee cycli. Als een indexbepaling
begint met twee basebepalingen van G, wordt er geen signaalintensiteit
gegenereerd. Er moet een signaal aanwezig zijn in één van de eerste twee cycli
om demultiplexing-prestatie te garanderen. Bij het selecteren van indexen
tijdens het maken van runs wordt een waarschuwing voor lage diversiteit
weergegeven als de indexen niet aan de diversiteitseisen voldoen. U kunt deze
waarschuwing voorkomen door indexsequenties te kiezen die bij elke cyclus een
signaal in beide kanalen leveren. u Rood kanaal: A of C u Groen kanaal: A of T
Dit basebepalingsproces garandeert nauwkeurigheid bij het analyseren van low-
plexmonsters. Zie voor meer informatie over de sequenties van uw indexen de
bijsluiter TruSeq Custom Amplicon Kit Dx (documentnr. 1000000029772). Tijdens
het aanmaken van de run in Local Run Manager kiest u het aantal monsters dat u
wilt testen. Voorgestelde indexcombinaties die voldoen aan de eisen voor
indexdiversiteit worden automatisch door de software ingevuld. Hoewel u niet
verplicht bent de voorgestelde indexcombinaties te gebruiken, wordt het wel
aanbevolen.
Documentnr. 1000000030329 v04 NLD
15
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
Revisiegeschiedenis
Document
Documentnr. 1000000030329 v04
Documentnr. 1000000030329 v03
Doc u m e n tn r. 1000000030329 v02
Doc u m e n tn r. 1000000030329 v01
Doc u m e n tn r. 1000000030329 v00
Datum
Augustus 2021
De c e m be r 2019
Ja n u a ri 2019
Augustus 2018
November 2017
Omschrijving van wijziging Adres van de gemachtigde vertegenwoordiger van de
EU bijgewerkt.
Adres van de gemachtigde vertegenwoordiger van de EU bijgewerkt. Adres van de
Australische sponsor bijgewerkt. Informatie over v2.5 reagenskits toegevoegd.
Voorgeschreven markeringen bijgewerkt.
Eerste uitgave.
Documentnr. 1000000030329 v04 NLD
16
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Workflowhandleiding voor Germline Variant-analysemodule in Local Run Manager voor NextSeq 550Dx
Technische ondersteuning
Voor technische ondersteuning neemt u contact op met de afdeling technische ondersteuning van Illumina.
Website: E-mail:
www.illumina.com te c h su pport@ illu m in a .c om
Telefoonnummers van klantenondersteuning van Illumina
R egi o N oor d -Amer i k a Australië B el gi ë China Denemarken Duitsland Fi nl a nd Fr a nk r i j k Hongkong Ierland Italië Japan Nederland Nieuw-Zeeland Noorwegen Oos t enr i j k S i ngap or e Spanje Ta i wa n Verenigd Koninkrijk Z wed en Z wi t s er l and Overige landen
Gratis telefoonnummer +1 800 809 4566 +1.800.775.688 +32 80077160 400.066.5835 +45 80820183 +49 8001014940 +358 800918363 +33 805102193 800960230 +353 1800936608 +39 800985513 0800 111 5011 +31 8000222493 0800 451 650 +47 800 16836 +43 800006249 +1.800.579.2745 +34 911899417 00806651752 +44 8000126019 +46 850619671 +41 565800000 +44 1799 534 000
Regionaal telefoonnummer
+32 34002973
+45 89871156 +49 8938035677 +358 974790110 +33 170770446
+353 016950506 +39 236003759
+31 207132960
+47 21939693 +43 19286540
+34 800300143
+44 2073057197 +46 200883979 +41 800200442
Veiligheidsinformatiebladen (SDS, safety data sheets) — zijn verkrijgbaar op
de website van Illumina via support.illumina.com/sds.html.
Productdocumentatie–beschikbaar voor downloaden in pdf-vorm via de website van
Illumina. Ga naar support.illumina.com, selecteer een product en klik
vervolgens op Documentation & Literature (Documentatie en literatuur).
Documentnr. 1000000030329 v04 NLD
17
BESTEMD VOOR IN-VITRODIAGNOSTIEK
Documentnr. 1000000030329 v04 NLD
Illumina 5200 Illumina Way San Diego, Californië 92122 VS +1 800 809 ILMN (4566) +1 858 202 4566 (buiten Noord-Amerika) t e c hsupport @i l l um i na . c om www.illumina.com
Illumina Netherlands B.V. Steenoven 19 5626 DK Eindhoven Nederland
BESTEMD VOOR IN-VITRODIAGNOSTIEK © 2021 Illumina, Inc. Alle rechten voorbehouden.
Australische sponsor Illumina Australia Pty Ltd Nursing Association Building Level 3, 535 Elizabeth Street Melbourne, VIC 3000 Australië
References
- Home · Illumina/Pisces Wiki · GitHub
- Support Center
- Safety Data Sheets (SDS)
- Illumina | Sequencing and array solutions to fuel genomic discoveries
- Illumina | Sequencing and array solutions to fuel genomic discoveries
- Legal | Legal Information for this website
- Support Center