Interogări pe fişiere încărcate şi seturi de date

Interogările de pe fişierele încărcate şi seturile de date sunt procesate de Serviciu de interogare şi Serviciu de calcul. Acest tip de coprocesare creşte performanţa interogărilor.

Serviciu de calcul procesează interogările în întregime sau parţial, şi returnează rezultatul la serviciul de interogare. Potenţial, întreaga interogare poate fi procesată de Serviciu de calcul, iar serviciul de interogare ar putea avea nevoie doar să realizeze procesarea suplimentară, locală a rezultatului.

Indiciu: Serviciu de calcul şi Serviciu de interogare se află pe acelaşi calculator şi implicit comunică între ele folosind un port efemer cerut de la sistemul de operare.

Modernizarea datelor la noul format Parquet

Formatul de parchet care este utilizat pentru a stoca fişiere încărcate şi seturi de date s-a modificat între Cognos Analytics versiunile 11.0.x şi 11.1. Rulaţi comanda ParquetUpgrade înainte ca utilizatorii să pornească rularea tablourilor de bord şi a rapoartelor. Aceasta asigură că toate încărcările de lucru beneficiază imediat de câştigurile de performanţă Serviciu de calcul . Dacă o interogare utilizează date care nu au fost convertite, serviciul de interogare iniţiază în mod intern conversia şi utilizatorii experimentaţi o degradare de performanţă unică atunci când rulează tablourile de bord, poveştile, rapoartele sau explorările din Cognos Analytics 11.1. Interogările următoare care sunt rulate de către serviciul de calcul folosesc datele convertite.

Pentru informaţii suplimentare, vedeţi Modernizarea fişierelor încărcate şi a seturilor de date la noul format Parquet .

Cele mai bune practici pentru îmbunătăţirea performanţei interogării pe fişierele încărcate şi seturile de date

Utilizaţi cele mai bune practici când lucraţi cu interogări bazate pe fişiere încărcate şi seturi de date:
  • Salvare expresii calculate frecvent ca coloane.

    Această practică reduce cantitatea de evaluare a expresiei la momentul rulării. Proiectarea, compararea şi sortarea referinţelor coloanelor simple şi a valorilor simple (literali) este mai eficientă decât evaluarea expresiilor.

  • Evitaţi stocarea numerelor mari de coloane care nu sunt niciodată utilizate de interogări.

    În timp ce datele sunt comprimate şi codate pentru a reduce cantitatea de spaţiu de stocare, este încă recomandat să evitaţi stocarea coloanelor redundante sau nenecesare.

  • Sortaţi intrarea de pe coloana care este utilizată cel mai frecvent în filtre.

    Pentru fişiere mari încărcate şi seturi de date, sortarea intrării poate îmbunătăţi evaluarea predicatelor. Sortarea datelor de pe coloana comună care este utilizată într-un filtru, de exemplu Ţara sau Magazin, grupează rândurile cu aceeaşi valoare. Dacă o interogare include predicate pe acea coloană, interogarea poate determina mai eficient ce blocuri de date poate ignora pe măsură ce navighează pe date. Folosiţi opţiunea de sortare la crearea unui set de date şi sortaţi intrarea înainte de a încărca un fişier.

Tipuri de date pentru a stoca date din fişiere încărcate şi seturi de date

Datele din fişierele încărcate şi seturile de date sunt stocate în următoarele tipuri de date:
  • Toate tipurile întregi (mic, întreg, şi bigint) sunt stocate ca bigint.
  • Toate tipurile numerice aproximative (real, float şi double) sunt stocate ca duble.
  • Toate valorile numerice precise sunt stocate ca zecimale până la precizia maximă de 38.
  • Toate tipurile de caractere (char, nchar, varchar, nvarchar, clob, nlclob) sunt stocate ca varchar naţional, fără o precizie maximă.
  • Toate tipurile temporale (dată, amprentă de timp, timp, timestamp/timp cu fus orar) sunt stocate ca amprentă de timp.
  • Tipurile de interval sunt stocate într-un format înţeles pentru a fi un interval. În ediţiile anterioare, valoarea a fost memorată ca şir. Serverul de rapoarte randează valori de interval.

Dacă a source value is a decimal data type with a precision > 38, serviciul de interogare încearcă să stocheze valoarea ca un tip zecimal cu o precizie de 38. Dacă o valoare este prea mare, serviciul de interogare returnează o eroare care indică coloana sursă, valoarea şi numărul de rând logic din datele de intrare.

Spaţiile de la sfârşit sunt înlăturate din orice valori caracter.

Amprentele de timp şi orele cu fusuri orare sunt normalizate la o valoare bazată pe timpul universal coordonat (UTC).