Risorse

Raccolta di materiali utili per studiare e lavorare meglio: guide, tool, repository, libri e documentazione. Le risorse coprono SQL Server, Azure e Data Platform in generale, includendo integrazione, automazione, BI/analytics e data engineering, organizzate per argomento.

Python Tools for Visual Studio

Davide Mauri

Python-LogoInformazione non freschissima ma comunque importante da sottolineare, visto anche il crescente interesse verso la Data Science in ambito Microsoft, come evidenziato anche all’evento del Technical Cloud Day in cui l’interesse per Machine Learning & Co. è stato veramente molto alto.

Come sottolineato anche durante l’evento suddetto, Python, insieme ad R, rappresenta uno dei linguaggi “must” della Data Science (ci starebbe, in effetti, un post dedicato…me lo appunto!) ed è quindi importante segnalare che a Dicembre 2015 Microsoft ha rilasciato un aggiornamento (2.2.31124.00) per Python Tools for Visual Studio (PTVS) che permette di usare Python con Visual Studio, l’IDE per eccellenza:

Qual è la tabella più grande nel DB corrente?

Sergio Govoni

Può succedere di avere la necessità di sapere quale sia la tabella più grande (in termini di spazio occupato), nel database su cui si sta lavorando.

Ci sono diversi modi per rispondere a questa domanda, si potrebbe utilizzare il report standard Disk Usage by Top Table fornito da SQL Server Management Studio (SSMS) oppure, se si volesse effettuare l’operazione attraverso T-SQL, si potrebbe eseguire la stored procedure di sistema sp_spaceused per ogni tabella del DB, salvando tutti i risultati parziali in una tabella temporanea per poi ordinarli in funzione della colonna “reserved” o “data”.

Webinars su Data Lake e U-SQL

Davide Mauri

L’argomento caldo del momento, il “Data Lake” è sempre più caldo e quindi Microsoft ha programmato una serie di webcast dedicati alla soluzione offerta da Azure rispetto all’esigenza di creare e sfruttare il concetto di “Data Lake”. Una buon riassunto per capire la differenza tra un Data Warehouse ed un Data Lake è questa, definita da SAS e direi che è piuttosto sensata:

edw-vs-data-lake-v2

Per aiutare sviluppatori, data scientists e “bi guys” a capire come utilizzare al meglio Azure Data Lake, sono stati programmati diversi webcast fatti direttamente dal team di sviluppo. Il primo, come annunciato, è già stato erogato, gli altri arriveranno prossimamente, a partire dal 2 Febbraio.

Microsoft R Webinars

Davide Mauri

Rlogo2Vista la crescente importanza di R all’interno della Data Platform, Microsoft ha iniziato l’erogazione di una serie di webcast a supporto di questo linguaggio, per aiutare chiunque lo desideri ad impararlo ed acquisire esperienza e manualità. L’elenco degli appuntamenti è il seguente:

  • Introduction to Microsoft R Open
  • Using Microsoft R Server to Address Scalability Issues in R
  • Data Mining with Microsoft R Server
  • Best Practices for using Microsoft R Server with Hadoop
  • Using Microsoft R Server to Operationalize your Analytics

qui il link per registarsi ed accedere, nel caso non possiate partecipare in diretta ai webcast, alle registrazioni:

SQL Server 2016 CTP3 In-Memory OLTP Whitepaper and Videos

Sergio Govoni

SQL Server è nato in un periodo storico in cui il costo della memoria RAM era ordini di grandezza più elevato rispetto al costo dello storage, da qui la decisione iniziale di persistere sempre i dati nello storage mantenendoli in memoria solo per il tempo strettamente necessario all’elaborazione. Ora però lo scenario è cambiato, e non è difficile trovare database server con 500 MB di RAM.

La tecnologia In-Memory OLTP, introdotta con SQL Server 2014, consente di beneficiare del costante calo della memoria RAM per aumentare le prestazioni delle operazioni OLTP fino a 30 o addirittura 40 volte. Teoricamente, le prestazioni di alcune query posso migliorare di 100 volte… da qui il prende il nome il progetto (In-Memory OLTP), originariamente chiamato “Hekaton” che nella lingua greca significa Cento!