BIOINFORMATYKA - THETAtheta.edu.pl/.../2019/10/bioinformatics2_lecture3.pdfBIOINFORMATYKA 1. Wykład...

Post on 16-Jul-2020

1 views 0 download

Transcript of BIOINFORMATYKA - THETAtheta.edu.pl/.../2019/10/bioinformatics2_lecture3.pdfBIOINFORMATYKA 1. Wykład...

BIOINFORMATYKA

1. Wykład wstępny

2. Biologiczne bazy danych

3. Bazy danych: projektowanie i struktura

4. Sekwencjonowanie następnej generacji

5. Sekwencjonowanie następnej generacji

6. Funkcjonalna adnotacja polimorfizmów

7. Funkcjonalna adnotacja polimorfizmów

8. Bash

9. Bash

10. Analiza asocjacyjna

11. Analiza asocjacyjna

12. Wybrane algorytmy

13. Wybrane algorytmy

14. - 15. Literatura 2019

WSTĘP

1. Konieczność zarządzania i manipulowania danymi w bioinformatyce

2. Przykładowe narzędzia tworzenia baz danych

3. Przykładowe narzędzia do manipulowania danymi

4. Przykładowe zastosowanie – Excel

5. Przykładowe zastosowanie - MySQL

Copyright ©2019, Joanna Szyda

bazy danych

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

20112013

2017

dynamiczna

duża

Copyright ©2019, Joanna Szyda

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Copyright ©2019, Joanna Szyda

NCBI RefSeq data base

0

1E+10

2E+10

3E+10

4E+10

5E+10

6E+10

01-2003 25-2007 50-2011 75-2016 95-2019

amino-acids

amino-acids

0

50000000

100000000

150000000

200000000

250000000

01-2003 25-2007 50-2011 75-2016 95-2019

records

records

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Copyright ©2019, Joanna Szyda

Bazy danych NCBI

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Copyright ©2019, Joanna Szyda

>NG_034204.1 Homo sapiens coiled-coil domain containing 181 pseudogene (LOC103568124) on chromosome 12

AGCTGGAATTTCTTATAGGATTCATACATAAAGACACAAAGGTTTTATGTCCTCAAAAATTGATCTGCCAGAGAGGCCCA

GATGGAGGACACAGAGGCATGCTGTTGCCATGGCAGTGTGGTCCTGGCTGCTGCGGAGGCAGGTGCCAGGGTCTCCCTTG

CCTCGATGTGAAGAGCTTAGAAAGCGGAGGAGAGGAGAACTCCCCTGGCCGTCTCTGTGACCCCAGCCGCCGCATTTTAC

ACAGACAGGAGGGAAACAGAGGGAGAGAAGGGAAGGACGGTGTGGAGTAGAAATATTAATGGTGGGAGAGAGGAAAATGA

ATGAAAATAAAGAGACTGATTCAAAAGAAAGTGAAGAATACAAAGATGAATCTGAAAAGGACCTGGAGGGGTTAACTAAT

GAAAATGAAAAAAGTGATGCCAGCATAATAGAGATGGCTTGTGAGAAGGAAGAGAATATTAACCAAGACTTAAAAGAGAA

TGAAACAGTAATAGAACACAGCAAACAGCTTTCTGATCCTGACAAATCTTTGCAGGATGAGGTCTCACCAAGAAGAAATG

ACTTCATTTCGGTACCGAGTATTCAACCTTTGGATCCCATATCAGATTCAGATAGTGAAAACTCTTTCCAGGAGTCCAAA

CTAGAAAGCCAGAAAGACTTGGAGGAGGAAGAGGATGAGGAAGTAAGGTGATACATTATGGAGAAAATTGTACAAGCTAA

CAAGCTTCTATAGAATCAAGAACCCGTGAATGATAAAAGGGAGTGAAAATTTAAGCTCAAGGACAAATTAGTTGATCTGG

AAGTTCCTCCACTAAAAGACACTAATACTTACAAAAGTTATTTTGAAAATGAAAGAAATATATTTGGGAAACTGTCACAG

TGATGTATTTCCAATGATTTGGGACAAGAAAATATGCTCCTGTCACTTATTAATGGAAGCTGTGAAATAAACAAGGATAG

GACAATACTGGTAGAGAGAGATGGAAAATTTGAACTTCTGAATTTACAAGACATTGAAGAGTCAGGGGTATTTGCCTCCC

ATTAATAATGCAAATAGTACAGAAAATGACCCTCAGCAGGTGTTACCCAGATCTTCCAACTCCTGTGTCAGTGGCATCAA

GAAAGAAGATTCTGCAGCAAAGATTGATGTTGTCACTCACTCATCAACAGGAGAGCCGTTGGCTTATATCCCTCCACTTA

TAAGTTGGCTTATATCCCACCACTCAACCGCAAGACTTGTCCAAGCTCTGCTGCCATCTCAGATCGAAGTAAAGGGAATG

GGAAATCTAATCAGGACAGTCTGCACATATCTCATCAGTGACCTCAACATACTGTCTTTCCCCTTGACAGAAAGAACTAC

AAAACGAGAACAAAAGAGAGAAAAGCTGAAAAGAGAGGAAGAGCAACAGAAAATAGAAGAAGAGGAAGAAAAAAAGAGGG

AGAATGGCATAGTATTTAAAGCATGGTTGCAAAAGAAAAGAGAGCAGGTCTTAGAAATGAGGAGAATTCAGCAAGCAAAG

CAGATTGAAGACATGAACAGCAGAGTAAGTAAAACTTTTCTGAAAAATAAGTTCATACAGATATGAAAGCTGAACTTAAT

TACAAAAGGGAGTCTGGATATCAGCCTATGAAAGAAGTAGAAAAGTGG

>NG_028783.2 Homo sapiens RNA polymerase I-specific transcription initiation factor RRN3-like (LOC100129955) pseudogene on chromosome 2

AAATAATGAATTTTAGAAGTCGGATAAAATTCTTCCTAAAAGGATTCATTATATAAAGCAAATAGCTGAACAATGTCAGG

TTGTAACATAGTAATCAAGAGAAAGAGCTTCCAGGCGAGGTGCAGCTATCACTTTAAGCCCCGGGGCAACCAGGCTGCTT

CTCACATGGTTGCCGGGGAAGCAGAGGCTTCAGCTTCTGTGGTCAAGAAGCTGGGTATGTCATGGACCAGTATTTCAGAT

ATGCTTGCATTCAAGAATGATTTTTCCAGCTCTCCCCCAAGAAAAATTGTTCATCTTGATGGAACGGGGACAGAAGTCTT

GCCGAAGGACAAAGAGTGAAACAAATTTAACTTTGAGCTGTTGAAGAGCCAGTTGTGAGATTCAAACATAAAGGATGACC

AGATCTTGAACTGGCTGTGAAAATTTTGCTCTTCTATCATGTACTTGGCAAAAGACTTTGAGCAGCTCCTCAGTATTACA

TTGAGATTGCCTTGGTTGAATAGAATTCAAACAGTGGTGGAAGAGTATTTGGCTTCTCTGGGTAGTCTTGTAACAACAGA

CTCTTCCTTAGCCCAAGTCTCAGCATAATTGCTTCCCATTTGGCGTACCCTCCTTGAATGATCATTAAGAAGAGCCATGT

AAATGTTTCAGATTCTGATGATGGAGATGATTATCTTCCTGCAGATTTTGACACACGTCATACAACCTTACAAATAACAG

CAAGATATGTCCCACTGGCACTGTGGTTTCTTTTGCCCATACTGGTGGAAACATTTCCATTTGTTCAATCAGAGAGAACA

CTGGAATGTTACATTCATAACTTACTAAAGATTAGTATATACTTTCCAACCTTGAGGAATGAAATTCTGAAGCTTATTAT

TAAAAATCTATTCAAATTGGATGTGAATACATTCTGGCATGATATTGAAGATGCTGAGGAAACAGCAGCTCAAACTTGT

…….

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Baza danych o unasiennianiu bydła dynamiczne zmiany

Copyright ©2019, Joanna Szyda

Nazwa

buhajaNr buhaja Data prod 1 Obj 1 Rm 1 Rpl 1 Konc

1 Po

rozm1 Dyskw 1 Morf 2 Obj 2 Rm 2 Rpl 2 Konc

2 Po

rozm2 Dyskw 2 Morf

LEGINS PL005062430529 02/01/2003 7 2 70 1463 50 0 0 0 0 0 0 0

LEGINS PL005062430529 03/01/2003 7.5 3 80 1306 60 0 0 0 0 0 0 0

LEGINS PL005062430529 03/02/2003 5 3 80 1330 50 0 5 3 80 1144 0 0

LEGINS PL005062430529 06/02/2003 5 3 80 1257 50 0 3.5 2 70 695 0 0

LEGINS PL005062430529 10/02/2003 6 3 80 1647 60 0 6 3 80 841 0 0

LEGINS PL005062430529 13/02/2003 3 0 0 0 0 NAS.B. RZADKIE 0 2 0 0 0 0NAS.B.

RZADKIE0

LEGINS PL005062430529 17/02/2003 6 3 80 1365 50 0 4.5 3 80 726 0 0

LEGINS PL005062430529 21/02/2003 5 3 80 1483 60 0 5 2 70 668 0 0

LEGINS PL005062430529 24/02/2003 4 3 80 1600 50 0 4 3 80 1119 0 0

LEGINS PL005062430529 27/02/2003 5 3 80 1543 60 0 4 3 80 766 0 0

LEGINS PL005062430529 03/03/2003 5.5 3 80 983 50 0 4 2 70 1077 0 0

LEGINS PL005062430529 06/03/2003 9 3 80 1237 60 0 6 2 70 872 0 0

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Baza danych o mastitis identyfikacja i usunięcie błędów

Copyright ©2019, Joanna Szyda

nrkr ltf_2 tnf_2 lyz_2 def_2 dabadakod_chor

oby

dni_chor

obylaktacja sire dam byear bmon bday

5100044824 AB CC CC A1A2/B1B2/C1 2006.04.22 INNA 1 1 5061906452 5003386953 2004 3 1

5100044824 AB CC CC A1A2/B1B2/C1 2006.09.09 MA 2 1 5061906452 5003386953 2004 3 1

5100044824 AB CC CC A1A2/B1B2/C1 2008.02.23 MA 3 2 5061906452 5003386953 2005 3 1

5003384942 AA CC CC A1A2/B1B2/C1C2 2003.10.21 ZPOA 1 2 607296446 763700797 1999 7 27

5003384942 AA CC CC A1A2/B1B2/C1C2 2005.01.01 MA 5 4 607296446 763700797 1999 7 27

5003384942 AA CC CC A1A2/B1B2/C1C2 2005.01.11 MA 9 4 607296446 763700797 1999 7 27

5003384942 AA CC CC A1A2/B1B2/C1C2 2005.01.30 MC 19 4 607296446 763700797 1999 7 27

5003384942 AA CC CC A1A2/B1B2/C1C2 2005.02.24 MC 12 4 607296446 763700797 1999 7 27

5064432255 AB CT CC A1A2/B1B2/C1C2 2000.08.22 ZPOA 1 1 609337741 5002795503 2000 11 26

5064432255 AB CT CC A1A2/B1B2/C1C2 2004.12.20 MA 2 2 609337741 5002795503 2000 11 26

5064432255 AB CT CC A1A2/B1B2/C1C2 2006.03.08 ZPOA 1 2 609337741 5002795503 2000 11 26

5064432255 AB CT CC A1A2/B1B2/C1C2 2006.05.11 INNA 1 3 609337741 5002795503 2000 11 26

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Baza danych o mastitis usuwanie niepotrzebnych informacji

Copyright ©2019, Joanna Szyda

nrkr ltf_2 tnf_2 lyz_2 def_2 dabadakod_chor

oby

dni_chor

obylaktacja sire dam byear bmon bday

5100044824 AB CC CC A1A2/B1B2/C1 2006.04.22 INNA 1 1 5061906452 5003386953 2004 3 1

5100044824 AB CC CC A1A2/B1B2/C1 2006.09.09 MA 2 1 5061906452 5003386953 2004 3 1

5100044824 AB CC CC A1A2/B1B2/C1 2008.02.23 MA 3 2 5061906452 5003386953 2005 3 1

5003384942 AA CC CC A1A2/B1B2/C1C2 2003.10.21 ZPOA 1 2 607296446 763700797 1999 7 27

5003384942 AA CC CC A1A2/B1B2/C1C2 2005.01.01 MA 5 4 607296446 763700797 1999 7 27

5003384942 AA CC CC A1A2/B1B2/C1C2 2005.01.11 MA 9 4 607296446 763700797 1999 7 27

5003384942 AA CC CC A1A2/B1B2/C1C2 2005.01.30 MC 19 4 607296446 763700797 1999 7 27

5003384942 AA CC CC A1A2/B1B2/C1C2 2005.02.24 MC 12 4 607296446 763700797 1999 7 27

5064432255 AB CT CC A1A2/B1B2/C1C2 2000.08.22 ZPOA 1 1 609337741 5002795503 2000 11 26

5064432255 AB CT CC A1A2/B1B2/C1C2 2004.12.20 MA 2 2 609337741 5002795503 2000 11 26

5064432255 AB CT CC A1A2/B1B2/C1C2 2006.03.08 ZPOA 1 2 609337741 5002795503 2000 11 26

5064432255 AB CT CC A1A2/B1B2/C1C2 2006.05.11 INNA 1 3 609337741 5002795503 2000 11 26

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Baza danych NCBI szybkie wyszukiwanie

Copyright ©2019, Joanna Szyda

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Baza danych Ensembl szybka wizualizacja

Copyright ©2019, Joanna Szyda

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Baza danych Ensembl Udostępnianie plików wynikowych w określonym formacie

Copyright ©2019, Joanna Szyda

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Udostępnianie plików wynikowych w określonym formacie

PLINK format .bim: chromosom, SNP, ?, position, alleles

1 rs1539637 0 1070788 G C

1 rs9442380 0 1077546 T C

1 rs4970358 0 1079125 A G

1 rs4970362 0 1084601 A G

1 rs9442385 0 1087198 T G

1 rs9660710 0 1089205 A C

1 rs1891905 0 1090080 C T

PLINK format .fam: FID, IID, FID, MID, SEX (1=m,2=f), fenotyp (1=case,2=control,-9=missing)

1341 NA06985 0 0 2 -9

1341 NA06993 0 0 1 -9

1340 NA06994 0 0 1 -9

1340 NA07000 0 0 2 -9

1340 NA07022 0 0 1 -9

1341 NA07034 0 0 1 -9 Copyright ©2019, Joanna Szyda

SCHEMAT BAZY DANYCH

prosta pola umieszczone w pojedynczym pliku

10084 10000089 10000526 10000031 F 1 1 0 30 6 5 16 5 18 24 2 17.000

10084 10000758 10000526 10000031 F 0 1 0 31 6 5 30 5 30 12 2 16.000

10084 10001094 0 0 M 0 0 0 0 0 0 0 0 0 -9 0 -9.000

10084 10000133 10001094 10000758 M 0 1 0 18 6 3 0 3 0 18 1 0.450

10084 10001039 10000526 10000031 M 0 1 0 28 6 5 16 5 17 40 1 0.000

10084 10000194 10000526 10000031 F 0 1 0 24 6 3 0 3 0 20 2 8.000

10084 10000526 0 0 M 0 1 0 60 6 5 38 5 38 24 2 42.000

10084 10000031 0 0 F 0 1 0 60 6 3 0 3 0 7 2 58.500

10130 10001565 10001436 10001364 F 1 1 0 38 6 5 18 5 20 75 2 30.000

10130 10000919 10001436 10001364 M 0 1 0 40 6 5 33 5 33 48 1 0.000

10130 10000299 10001436 10001364 F 0 1 0 32 6 5 17 5 19 36 2 32.000

10130 10000489 10001436 10001364 M 0 1 0 27 6 3 0 3 0 12 1 0.000

10130 10001436 0 0 M 0 1 0 62 6 3 0 3 0 10 2 42.000

10130 10001364 0 0 F 0 1 0 61 6 1 0 1 0 5 1 0.125

10038 10000572 10001250 10001511 F 1 1 0 28 6 5 15 5 15 48 1 12.000

10038 10000272 10001250 10001511 M 0 1 0 26 6 3 0 3 0 10 1 0.000

10038 10001295 10001250 10001511 F 0 1 0 25 6 1 0 1 0 3 1 0.000

10038 10000598 10001250 10001511 M 0 1 0 22 6 5 15 5 22 71 2 12.000

Copyright ©2019, Joanna Szyda

SCHEMAT BAZY DANYCH

relacyjna złożona z kilku powiązanych tabel

EKSPERYMENTkod eksperymentudatanazwisko wykonawcynr próbkinr mikromacierzy

WYKONAWCAnazwiskoemailjednostka

PRÓBKAnr próbkigatunekźródło RNAstatus

GENkod genusekw. DNA

EKSPRESJAkod eksperymentukod genuwartość ekspresji

relacja 1:1

relacja 1:wielu

relacja ?

relacja ?

Copyright ©2019, Joanna Szyda

KONIECZNOŚĆ ZARZĄDZANIA I MANIPULOWANIA DANYMI

Podstawowe zadania bazy danych

1. Przechowywanie

2. Zarządzanie / Edycja

3. Wyszukiwanie

4. Udostępnianie / Wizualizacja

Copyright ©2019, Joanna Szyda

narzędzia tworzenia baz danych

PRZYKŁADOWE NARZĘDZIA TWORZENIA BAZ DANYCH

1. MS Excel – znane narzędzie, najprostsze bazy danych, Windows

2. MS Access – przyjazny dla użytkownika, komponent MS Office Professional,

Windows

3. MySql – przyjazny dla użytkownika, Windows + Linux, darmowy:

http://dev.mysql.com/

4. SAS – profesjonalny pakiet zarządzania danymi, drogi, różne systemy operacyjne

5. Oracle – profesjonalny pakiet, wszystkie systemy operacyjne

Copyright ©2019, Joanna Szyda

narzędzia do manipulowania danymi

PRZYKŁADOWE NARZĘDZIA DO MANIPULOWANIA DANYMI

1. SAS – przyjazny dla użytkownika, wszystkie systemy operacyjne

2. Pakiet R – popularny, szeroka gama możliwości manipulowania i wizualizacji danych, darmowy• www.r-project.org

3. Perl (bioPerl) i Python – bardzo popularne wśród bioinformatyków, dość proste, wszystkie systemy operacyjne, specjalne biblioteki do analiz bioinformatycznych, darmowe:• www.perl.org• www.python.org

4. Kompilowane języki programowania – Fortran, C, C++

Copyright ©2019, Joanna Szyda

Excel

PRZYKŁADOWE ZASTOSOWANIE – EXCEL

1. Najprostsza „baza danych”

2. Windows

3. Zastosowanie filtrów

4. Poprawność danych

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – EXCEL

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – EXCEL

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – EXCEL

family ID individual ID ID of Father {0 = not in pedigree}ID of Mother {0 = not in pedigree}sex Age (at interview) {No Info = 0}Ethnicity {0=No Info;1=American Indian;2=Asian;3=Pacific Islander;4=Black, non-Hispanic;5=Black, Hispanic;6 = White, non-Hispanic;7=White Hispanic;8=Other}alcohol dependence {0 = No Info : 1 = "Pure Unaffected" : 2 = Never Drank : 3 = Unaffected with some symptoms : 5 = Affected}Age of OnsetMaximum number of drinks in a 24 hour period {No Info = -9}(# packs per day for 1 year) {No Info = -9}

10084 10000089 10000526 10000031 F 30 6 5 16 24 17

10084 10000758 10000526 10000031 F 31 6 5 30 12 16

10084 10001094 0 0 M 0 0 0 0 -9 -9

10084 10000133 10001094 10000758 M 18 6 3 0 18 0.45

10084 10001039 10000526 10000031 M 28 6 5 16 40 0

10084 10000194 10000526 10000031 F 24 6 3 0 20 8

10084 10000526 0 0 M 60 6 5 38 24 42

10084 10000031 0 0 F 60 6 3 0 7 58.5

10130 10001565 10001436 10001364 F 38 6 5 18 75 30

10130 10000919 10001436 10001364 M 40 6 5 33 48 0

10130 10000299 10001436 10001364 F 32 6 5 17 36 32

10130 10000489 10001436 10001364 M 27 6 3 0 12 0

10130 10001436 0 0 M 62 6 3 0 10 42

10130 10001364 0 0 F 61 6 1 0 5 0.125

10038 10000572 10001250 10001511 F 28 6 5 15 48 12

10038 10000272 10001250 10001511 M 26 6 3 0 10 0

10038 10001295 10001250 10001511 F 25 6 1 0 3 0

10038 10000598 10001250 10001511 M 22 6 5 15 71 12

10038 10001250 0 0 M 68 6 3 0 10 0

10038 10001511 0 0 F 52 6 3 0 14 31

10006 10000264 10000130 10000650 M 34 6 5 16 26 0

10006 10000025 10000130 10000650 M 35 6 5 18 36 13

10006 10000707 10000130 10000650 M 26 6 5 20 15 6

10006 10001405 10000130 10000650 F 28 6 5 23 10 0

10006 10000130 0 0 M 58 6 5 30 24 -9

10006 10000650 0 0 F 59 6 1 0 3 0

10027 10000398 0 0 M 58 6 5 24 42 41

N=1 615Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – EXCEL

1. Otworzyć dane gawdata.txt w edytorze tekstu ASCII

2. Otworzyć w Excelu (rozdzielane tabul. / importować wybrane kolumny)

3. Utworzyć prostą bazę danych

• Nadać nazwy kolumn

• W kolejnym arkuszu opisać nazwy kolumn = utworzyć dokumentację

• Przekodować brakujące dane (znajdź - zamień)

• Zaznaczyć kolorem wybrane dane (formatowanie warunkowe)

• Filtry

o Ustawić filtr dla kolumny z płcią

o Zaznacz danedanefiltruj

o Przykładowe filtry tekstu np. kobiety

o Ustawić filtr dla kolumny z liczba drinków

o Przykładowe filtry liczbowe np. powyżej średniej

o Filtr zaawansowany (kombinacje filtrów dla jednej kolumny)

• Zdefiniować poprawność danych

o Danepoprawność np. granice wieku wystąpienia choroby alkoholowej - wykorzystanie opcji "pełna liczba między"; smoking status - "wykorzystanie listy", zakreśl niepoprawne dane

o Wprowadzić próbne dane: poprawne i niepoprawne

4. Utworzyć tabelę przestawną i raport danych

Copyright ©2019, Joanna Szyda

MySQL

PRZYKŁADOWE ZASTOSOWANIE – MySQL

1. Windows, linia komend

2. Tworzenie bazy danych

3. Tworzenie tabel

4. Operacje na kolumnach danych

5. Wprowadzanie danych do bazy

6. Wybieranie rekordów danych

7. Podstawowe obliczenia

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – MySQL

http://dev.mysql.com/downloads

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – MySQL

1. Create database alcohol;

2. Create database bioinfo;

3. Show databases ;

4. Drop database bioinfo;

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – MySQL

1. Use alcohol ;

2. Create table drinks (family int , individual int ,father int, mother int, sexchar(1), agei int, ethnicity int, alc int, ageo int, maxdrink int, cigarets int) ;

3. Desc drinks ;

4. Create table tmp (nr varchar(14));

5. Show tables ;

6. Drop table tmp ;

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – MySQL

1. Alter table drinks add column age int ;

2. Alter table drinks drop column age ;

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – MySQL

1. Load data infile ‘C:\ASIA\CLASS\bioinformatics2\lectures\gaw.txt’ into table drinksfields terminated by ‘ \t’ ;

2. Insert into drinks set individual=42, sex='M' ;

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – MySQL

1. Select * from drinks;

2. Select * from drinks where sex=‘M’ ;

3. Select * from drinks where maxdrink>50 ;

Copyright ©2019, Joanna Szyda

PRZYKŁADOWE ZASTOSOWANIE – MySQL

1. Select avg(agei) from drinks;

2. Select avg(agei) from drinks group by sex ;

3. Select sex, avg(agei) from drinks group by sex ;

Copyright ©2019, Joanna Szyda

1. Konieczność zarządzania i manipulowania danymi w bioinformatyce

2. Przykładowe narzędzia tworzenia baz danych

3. Przykładowe narzędzia do manipulowania danymi

4. Przykładowe zastosowanie – Excel

5. Przykładowe zastosowanie - MySQL