SQLtutor - chyby ZS 2007

Revize bodového hodnocení

-- http://josef.fsv.cvut.cz/~gin/SQLtutor/sqlquiz/quiz 

DROP TABLE revize;
CREATE TABLE revize (
   id int NOT NULL,                -- id otazky
   jmeno varchar(30) NOT NULL,     -- kdo podava pripominku k hodnoceni
   navrh int,                      -- navrh noveho bodoveho hodnoceni
   komentar text
);
--
INSERT INTO revize (id, jmeno, navrh) VALUES (100, 'cepek', 3);
INSERT INTO revize (id, jmeno, komentar) VALUES (101, 'cepek',
                    'divna otazka vyradit');
INSERT INTO revize VALUES (1002, 'cepek', 4, 'nedocenena otazka');
--
SELECT * FROM revize;cepek@jama:~/work$

Eliška Svobodová

101

procházím si testy na Vašem SQL tutorovi. Moc se mi líbí tento způsob učení jazyka SQL přímo na příkladech s možností zobrazení správného řešení.

Dnes na cvičení jste říkal, že pokud najdeme chybu, tak se máme ozvat. Nevím, jestli se moje poznámka dá charakterizovat jako upozornění na chybu. Spíše chci poukázat na nejasné položení otázky č. 101. Vypište seznam všech zaměstnanců. Mám k dispozici tato data.

Tabulka Sloupce

 pracoviste   	  kod, popis  
 zamestnanci   	  id, jmeno, prijmeni, pracoviste_kod, vek  
 mzdy   	  id, vlozeno, zamestnanec_id, castka

Za seznam zaměstnanců bych spíše než výpis celé tabulky "zamestnanci" (id, jmeno, prijimeni, pracoviste_kod, vek) považovala seznam jmen a přijímení zaměstnanců (pouze sloupce jmeno a prijimeni). Proto jsem dotaz napsala takto: SELECT jmeno, prijmeni FROM zamestnanci;

Při vyhodnocení SQL mi tutor ohlásil chybnou odpověď. Myslím ale, že ze zadání není zcela jasné, zda má být výsledkem jmenný seznam nebo jmenný seznam doplněný o id, kód pracoviště a věk.

Nerada bych, aby mne taková nejasnost potkala při testování v závěru semestru :-)

Děkuji a ještě jednou chválím možnost procvičování dotazů v SQL tutorovi.

ano : 1

206

našla jsem ještě další nesrovnalost u otázky č. 206. Zde je jasně daná otázka: Jaké je id filmu 'Dům u jezera'? K dispozici jsou data:

Tabulka Sloupce

 filmy   	  id, rok, titul  
 umelci   	  id, jmeno  
 obsazeni   	  film_id, umelec_id, poradi  
 rezie   	  film_id, umelec_id

Odpověď na tuto otázku by měl být pouze jeden sloupec obsahující id. Napsala jsem proto příkaz:

SELECT id FROM filmy WHERE titul='Dům u jezera'

Dle Vašeho správného řešení však má odpověď obsahovat dva sloupce: id a název filmu. A to je podle mě chyba, neboť dotaz zní jasně a týká se pouze id.

Nejsem žádný expert, proto se nezlobte, že opět píši. Jen mě baví procházet si úlohy v SQL tutorovi a zkoušet je řešit.

ano : 1

510

drobné nedorozumnění jsem našla u otázky č. 510: Které evropské země (Europe) mají HPD na hlavu vyšší než Velká Británie (United Kingdom). Myslím, že zde by jako správná odpověď měl stačit 1 sloupec tvořený seznamem evropských států. Zde jsou za správnou odpověď požadovány sloupce dva a to stat a region. Otázka zní, které Evropské země, proto myslím, že stačí, když se tato podmínka objeví pouze v dotazu SQL (........WHERE region LIKE '%Europe%'...........) a nikoli jako další sloupec na výstupu. Popřípadě by bylo dobré uznat jako správnou odpověď také samostatný sloupec se státy splňujícími podmínku (Evropa, HDP na hlavu).

ano : 5 na výstupu má být jen jméno země-

412

Podobným případem je v otázka* č. 412: *Které země mají v seznamu světového dědictví UNESCO zapsáno deset a více památek?

SELECT zeme
FROM unesco
GROUP BY zeme
HAVING COUNT(pamatka) >= 10;

Tento příkaz vypíše seznam zemí, ale bez počtu památek, což je považováno za chybnou odpověď, ale v otázce není napsáno, že je třeba zobrazit i počet.

ano : 4 zde jsem doplnil do zadání uveďte zemi a počet památek (ty počty památek jsou zajímavé)

Pavel Seeman

Zkoušel jsem si příklady v SQL tutoru a objevil jsem dvě drobné chybky u příkladů 205 a 217. O co jde?

205

U 205 je dotaz: Jaké id má Miloš Forman? Z otázky chápu, že mám vypsat jen příslušné id, ale za správnou odpověď není považován zápis:

SELECT id
FROM umelci
WHERE jmeno = 'Miloš Forman'

Místo toho je správný výpis i se jménem Miloš Forman. Jde o stejný typ chyby jako byl u příkladu 206 (viz. zveřejněné chyby na gamě). A o to samé se jedná i u příkladu 217 (Vypište všechny filmy a herce za rok 2003.), kdy správné řešení opět vyžaduje i sloupec s rokem 2003.

ano: 1

217

ano: 3

600

několik připomínek k SQL tutoru:

V datasetu 600 u tabulky dopravni_letadla bych přejmenoval sloupec spolecnost na vyrobce, aby se název nepletl se sloupcem stejného jména v tabulce letecke_spolecnosti. ( U některé z otázek mi nebylo jasné, jestli se společností myslí výrobce či provozovatel letadel.)

ano : 3 změnil jsem a doufám, že jsem při tom do testu nezanesl příliš nových chyb

800

U datasetu 800 chybí u tabulky cleneni v zadání sloupec tok_id. (V zobrazených datech již je.)

ano : 5

704

V příkladu 704 bych změnil otázku na: Jaká je celková rozloha rybníků podle povodí? Uveďte vždy povodí, celkovou rozlohu a počet rybníků v daném povodí. Ze současného dotazu není podle mě jasné, že se má vypsat i sloupec povodí. Jedná se o podobnou chybu jako byla u 205 a 217, ale tentokrát bych spíše upravil zadání než SQL dotaz.

ano : 3

213

zkoušel jsem si opět příklady z SQL tutoru a objevil jsem, že v 213 je úplně špatně SQL dotaz. Otázka zní: Kteří herci hráli alespoň pětkrát v hlavní roli?

Moc jsem si se zadáním nevěděl rady a tak jsem zkusil příkaz:

SELECT jmeno
FROM umelci
JOIN obsazeni
ON id = umelec_id
GROUP BY jmeno
HAVING COUNT(poradi) >= 5;

o kterém jsem tušil, že vypíše herce, kteří hráli v alespoň pěti filmech, bez rozlišení role. K mému překvapení SQLtutor vyhodnotil odpověď jako správnou. Zdálo se mi to ale podezřelé, že by nebyl žádný herec s pěti a více filmy a třeba jen s jednou hlavní rolí. Podíval jsem se tedy do nápovědy, ale ta mi moc nepomohla - zdála se mi taky chybná. Tato domněnka se mi potvrdila, když jsem si prošel přednášky o subselectech a napsal příkaz:

SELECT jmeno, COUNT(poradi), SUM(poradi)
FROM umelci
JOIN obsazeni
ON id = umelec_id
GROUP BY jmeno
HAVING jmeno = 'Morgan Freeman';

Z výsledku (počet filmu je 5 a suma pořadí je 9) je jasné, že Morgan Freeman nemohl hrát v alespoň pěti filmech hlavní roli.

Nechtěl jsem Vám poslat jen zprávu o chybě, ale i správný dotaz a tak jsem docela dlouho zkoušel vyřešit příklad přes subselecty, ale nakonec to bylo mnohem jednodušší:

SELECT jmeno
FROM umelci
JOIN obsazeni
ON umelci.id = umelec_id
GROUP BY jmeno
HAVING (2*COUNT(poradi) - SUM(poradi)) >= 5;

(Atribut pořadí je pouze 1 či 2.)

ano : 8

... nicméně se mi Vaše řešení moc nelíbí (je to takový trik s pořadím). Mně tam chyběla jedna podmínka WHERE poradi=1 a nakonec jsem to napsal jako JOIN (podobně jako Vy, ale s explicitní a jasnou podmínkou). Ve sbírce příkladů jsem to opravil, mělo by to být správně i na sqltutorovi.

        SELECT jmeno
          FROM umelci
               JOIN obsazeni
               ON id = umelec_id
         WHERE poradi=1
         GROUP BY jmeno
        HAVING COUNT(poradi) >= 5;

* 214

kompletně jsem si projel otázky k datasetu filmy (200) a objevil jsem ještě dvě nesrovnalosti.

214: Vypište filmy z roku 2006 seřazené podle obsazení (tj. počtu herců uvedených v databázi a titul filmu). Z otázky jsem pochopil, že mám vypsat filmy z roku 2006 seřazené podle obsazení a dále seřazené podle titulu (abecedy). Což bylo špatně. Zmátla mě ta závorka. Otázku bych tedy mírně upravil na: Vypište filmy z roku 2006 seřazené podle obsazení (tj. počtu herců uvedených v databázi). Uveďte obsazení a titul filmu.

* 204

204: Jaké jsou tituly filmů s id 3, 5, 7, 11? Zde je stejná chyba jako byla třeba u 206. Tutor chce navíc vypsat i sloupec s id, i když ze zadání to není jasné.

Zuzana Basíková

104

myslím,že lze jednodušší řešení :

select jmeno, prijmeni, zamestnanci.id
from zamestnanci
where pracoviste_kod='it';

ano : 3 (není to JOIN, ale jednoduchý select, snížil jsem počet bodů a změnil kategorii)

216

Co je v tabulkách jméno režiséra? jako umělce?

odpověď : 3 režiséři mohou být zároveň i herci a naopak. Zařadil jsem je proto všechny do tabulky umelci ... myslím, že je to tak v pořádku, ale mohu se mýlit. Zatím jsem to ponechal jak je.

309

nesrozumitelné zadání, má jen 3 body

názor : 1 Mně se otázka Na kterých tramvajových linkách je čtyřicet a více zastávek? zdá jasná, mohu se ale mýlit, je to příklad na použití agregační funkce COUNT, tři body jsou myslím dostatečné.

518

v SQLtutor se zobrazuje: Jaká je celkový populace ... ? čeština

ano : 3

802

chyba ve spojení tabulek, tok_id není v cleneni. podle mě by mělo být:

select jmeno
  from toky
       join stanice
       on toky.id=stanice.id
       join cleneni
       on stanice_id=stanice.id
where povodi = 'Berounka';

ano : 5 atribut tok_id jsem neměl uveden v tabulce datasets pro tabulku cleneni. Na totéž upozornil pan Seeman, viz výše.

bodové hodnocení

otázka 310: dala bych alespoň 5 bodů
otázka 608: těžká, má jen 3 body
otázka 610: těžká, má jen 3 body
otázka 613: dala bych alespoň 4 body
otázka 624: těžká, alespoň 4 body, není žádný bod
otázka 625: těžká, alespoň 4 body, není žádný bod
otázka 627: dost těžká, má jen 3 body
otázka 808: by měla mít více bodů než 9

výborně! tuto anketu (revize bodového hodocení) musíme nějak sjednotit. Připoměňte mi to na přednášce, uděláme si na toto téma příklad. Body pak budeme počítat zvlášť. Nepříjdete o ně.

Jana Hrnčířová

804

během procvičování SQL jsem přišla na nejasnost u příkladu č. 804. Na mojí odpověď se napsala následující hláška: ERROR: relation "limity_spa" does not exist. Přitom ani v zadaných tabulkách, ani v mé odpovědi se žádný takový parametr nevyskytuje. Když jsem použila odpověď z nápovědy, objevila se stejná hláška. Odpověď z nápovědy používá limity_spa jako název tabulky, ale tabulka se jmenuje limity_cm. Po úprave odpovědi z nápovědi též vyskočí stejná hláška.

ano : 8 v sql textu bylo zapomenuto puvodni jméno tabulky limity_spa (nyní limity_cm)

Jan Kopáč

pravděpodobně našel jsem chybu v sql tutorovi. Jde o otázku č. 627: Které letadlo má největší dolet? Uveďte výrobce, letadlo a dolet. I přesto , že jsem to dle mého napsal dobře mi to hlásilo chybu, podíval jsem se tedy na nápovědu, a zjistil jsem, že se tam odvoláváte na sloupec výrobce, který v zobrazení dat u tabulky dopravni_letadla neexistuje (místo toho je tam sloupec spolecnost). Co je ale pro mne nejzajímavější, výsledek je správný, čemuž nerozumím. Kdyžtak se na to zkuste podívat.

Obdobný problém je i u otázek č.613 a c.628. Takže pokud je to skutečně chyba, bude se vyskytovat i u dalších otázek odkazující se právě na tabulku dopravni_letadla.

ano : 5 opravil jsem datové tabulky a testy, ale zapomněl jsem na tabulky datasets, které se používají pouze pro tisk přehledu tabulek v tutorovi před zadáním otázky. Proto to chodilo, i když tutor říkal něco jiného.

619

U otázky č.619 bych raději přeformuloval dotaz z : Které typy letadel byly uvedeny do provozu v letech 1993 až 1995 Uveďte společnost, typ letadla a rok. na: Které typy letadel byly uvedeny do provozu v letech 1993 až 1995 Uveďte vyrobce, typ letadla a rok.

Chyba je způsobena přepsáním sloupce spolecnost na vyrobce v tabulce dopravni_letadla, tato otázka však zůstala zachována a mohla by dále někoho klamat.

ano : 1

511

Moc se mi ještě nelíbí odpověď otázky 511: Které země mají HPD vyšší než všechny evropské země (Europe). Z ní se mi nabízí vše řešit pomoci sum():

SELECT stat FROM staty
WHERE  hdp > (SELECT sum(hdp) FROM staty
               WHERE region LIKE '%Europe%');

oproti nabízené nápovědě s ALL:

SELECT stat FROM staty
WHERE  hdp > ALL (SELECT hdp FROM staty
                  WHERE region LIKE '%Europe%');

Z otázky dle mého vyplývá, které státy mají větší hdp, než je součet všech hdp evropských států. Podle nabízené verze z nápovědy dostaneme: Japan (hdp = 4 331 706 615 000) United States (hdp = 11 011 216 812 000) , když samotný součet hdp evropských států je 12 306 108 549 000. Odpověď by měla poté nulovou odpověď . Což je divné, hold dle otázky mi to tak vychází. Přesně jsem si totiž nebyl jistý užitím ALL, proto jsem si celou úlohu rozdělil do částí a ty mi po spojení nevyšly, jak by měly.

ano : 6 myslím, že ta otázka je po jazykové stránce správně, je ale opravdu matoucí. Přidal jsem tam alternativní formulaci na vysvětlenou. Ten příklad jsem dal do sbírky jako úlohu na poddotaz vracející tabulku, ve které musím porovnat všechny hodnoty (ALL), jinak to jde i přes MAX(). Matoucí podle mne je na tom to HDP. Pokud bych se ptal, kteří závodníci skočili výš než všichni závodníci Francie, nikoho by nenapadlo francouzské výsledky ve skoku do výšky sčítat. Snad je to teď srozumitelné.

HDP

Když si čtu po sobě ještě tento e-mail, všiml jsem si maličkosti, která se v otázkách ještě objevuje špatně. Jde o zkratku HPD místo HDP, min se vyskytuje ještě v otázce č.510 spolu právě s č.511. Půjde jen o otázky týkající se tabulky staty.

ano : 2

Martin Janata

Posilam nekolik oprav (dle meho nazoru) SQL tutora.

* 105

U otazky c. 105 se ve spravne odpovedi zamestnanci opakuji, jestli by nebylo lepsi pridat "group by prijmeni" a misto "castka" zjistovat "avg(castka)".

* 611

V otazce c. 611 neni explicitne receno, ze jsou ve vysledku pozadovany dva sloupce.

* 401

U otazky c. 401 neni moc logicke, ze jsou nektere pamatky v databazi vicekrat, jestli by tedy nestalo za to to zduraznit.

* 608

Posledni vec je jen kosmeticka uprava u otazky c. 608: jestli by nebylo srozumitelnejsi, kdyz by mezi vetami bylo a (misto carky).