Raccolta di materiali utili per studiare e lavorare meglio: guide, tool, repository, libri e documentazione. Le risorse coprono SQL Server, Azure e Data Platform in generale, includendo integrazione, automazione, BI/analytics e data engineering, organizzate per argomento.
L’argomento caldo del momento, il “Data Lake” è sempre più caldo e quindi Microsoft ha programmato una serie di webcast dedicati alla soluzione offerta da Azure rispetto all’esigenza di creare e sfruttare il concetto di “Data Lake”. Una buon riassunto per capire la differenza tra un Data Warehouse ed un Data Lake è questa, definita da SAS e direi che è piuttosto sensata:
Vista la crescente importanza di R all’interno della Data Platform, Microsoft ha iniziato l’erogazione di una serie di webcast a supporto di questo linguaggio, per aiutare chiunque lo desideri ad impararlo ed acquisire esperienza e manualità. L’elenco degli appuntamenti è il seguente:
- Introduction to Microsoft R Open
- Using Microsoft R Server to Address Scalability Issues in R
- Data Mining with Microsoft R Server
- Best Practices for using Microsoft R Server with Hadoop
- Using Microsoft R Server to Operationalize your Analytics
qui il link per registarsi ed accedere, nel caso non possiate partecipare in diretta ai webcast, alle registrazioni:
SQL Server è nato in un periodo storico in cui il costo della memoria RAM era ordini di grandezza più elevato rispetto al costo dello storage, da qui la decisione iniziale di persistere sempre i dati nello storage mantenendoli in memoria solo per il tempo strettamente necessario all’elaborazione. Ora però lo scenario è cambiato, e non è difficile trovare database server con 500 MB di RAM.
Con l’annuncio di Microsoft R Server è chiaro che non è più possibile evitare di parlare di “R” uno dei linguaggi della Data Science più di moda del momento. La prima cosa necessaria da fare è quindi capire da dove partire per fare proprio questo linguaggio, indipendentemente dal fatto che siate o vogliate essere Data Scientists, dato che è un linguaggio estremamente potente e sarà presente ovunque nel mondo dei dati, e quindi diventa un bagaglio culturale importante da portare con se.
Negli ultimi anni si fa un gran parlare di DAX e Tabular….come se OLAP e MDX fossero morti. E’ vero? Oppure la realtà è ben altra, e questa sensazione è solamente dovuta al fatto che il marketing di prodotto sta facendo (fin troppo bene) il suo lavoro? Come consulenti è sembre bene valutare attentamente pro e contro dell’uso di tecnologie nuove o di tecnologie mature (alla quale viene purtroppo dato un senso negativo al termine) perchè non sempre il nuovo è meglio, sopratutto dal punto di vista aziendale (costi, formazione, supporto….e via dicendo)
E’ disponibile un addin per Excel che permette di condividere parti di un foglio Excel in locale con Power BI (il servizio, non il programma Desktop) in modo da poter rendere l’informazione disponibile a chiunque (ne abbia i diritti di accesso)
Excel Dashboard Publisher
e qui la documentazione e gli esempi per iniziare:
Come avrete intuito, Microsoft sta prendendo molto seriamente il tema della Data Science e Data Culture (il rilascio di Microsft R Server ne è un esempio) e, come da sua tipica visione, si sta assicurando che questi temi raggiungano il maggior numero di persone possibili.
Per tutti coloro che volessero iniziare a prendere confidenza con il mondo della Data Science e per chi invece è già avviato in questo mondo è disponibile la Data Science Virtual Machine, che in un sol colpo fornisce un ambiente di sviluppo ideale: