Posts

Introducing Microsoft SQL Server 2016 (Preview 2)

Sergio Govoni

E’ stata pubblicata la seconda preview dell’eBook Introducing Microsoft SQL Server 2016.

Introducing SQL Server 2016 Preview 2

Rispetto alla prima edizione, di cui abbiamo parlato in questo post, nella seconda preview vengono descritte le nuove security feature: Always Encrypted, Row-Level Security, e Dynamic Data Masking; vengono discusse anche le nuove implementazioni che permettono di gestire in modo più efficiente la configurazione del database di sistema TempDB; mentre Query Store e Stretch Database permetteranno di gestire meglio le performance delle query. In ambito BI e alta disponibilità, la seconda preview del libro descrive le implementazioni su Reporting ServicesTabular, AlwaysOn Availability Groups e l’integrazione con il linguaggio R.

Python Tools for Visual Studio

Davide Mauri

Python-LogoInformazione non freschissima ma comunque importante da sottolineare, visto anche il crescente interesse verso la Data Science in ambito Microsoft, come evidenziato anche all’evento del Technical Cloud Day in cui l’interesse per Machine Learning & Co. è stato veramente molto alto.

Come sottolineato anche durante l’evento suddetto, Python, insieme ad R, rappresenta uno dei linguaggi “must” della Data Science (ci starebbe, in effetti, un post dedicato…me lo appunto!) ed è quindi importante segnalare che a Dicembre 2015 Microsoft ha rilasciato un aggiornamento (2.2.31124.00) per Python Tools for Visual Studio (PTVS) che permette di usare Python con Visual Studio, l’IDE per eccellenza:

Qual è la tabella più grande nel DB corrente?

Sergio Govoni

Può succedere di avere la necessità di sapere quale sia la tabella più grande (in termini di spazio occupato), nel database su cui si sta lavorando.

Ci sono diversi modi per rispondere a questa domanda, si potrebbe utilizzare il report standard Disk Usage by Top Table fornito da SQL Server Management Studio (SSMS) oppure, se si volesse effettuare l’operazione attraverso T-SQL, si potrebbe eseguire la stored procedure di sistema sp_spaceused per ogni tabella del DB, salvando tutti i risultati parziali in una tabella temporanea per poi ordinarli in funzione della colonna “reserved” o “data”.

Webinars su Data Lake e U-SQL

Davide Mauri

L’argomento caldo del momento, il “Data Lake” è sempre più caldo e quindi Microsoft ha programmato una serie di webcast dedicati alla soluzione offerta da Azure rispetto all’esigenza di creare e sfruttare il concetto di “Data Lake”. Una buon riassunto per capire la differenza tra un Data Warehouse ed un Data Lake è questa, definita da SAS e direi che è piuttosto sensata:

Microsoft R Webinars

Davide Mauri

Rlogo2Vista la crescente importanza di R all’interno della Data Platform, Microsoft ha iniziato l’erogazione di una serie di webcast a supporto di questo linguaggio, per aiutare chiunque lo desideri ad impararlo ed acquisire esperienza e manualità. L’elenco degli appuntamenti è il seguente:

  • Introduction to Microsoft R Open
  • Using Microsoft R Server to Address Scalability Issues in R
  • Data Mining with Microsoft R Server
  • Best Practices for using Microsoft R Server with Hadoop
  • Using Microsoft R Server to Operationalize your Analytics

qui il link per registarsi ed accedere, nel caso non possiate partecipare in diretta ai webcast, alle registrazioni:

SQL Server 2016 CTP3 In-Memory OLTP Whitepaper and Videos

Sergio Govoni

SQL Server è nato in un periodo storico in cui il costo della memoria RAM era ordini di grandezza più elevato rispetto al costo dello storage, da qui la decisione iniziale di persistere sempre i dati nello storage mantenendoli in memoria solo per il tempo strettamente necessario all’elaborazione. Ora però lo scenario è cambiato, e non è difficile trovare database server con 500 MB di RAM.

Microsoft R Application Network

Davide Mauri

MRO-Logo-1Con l’annuncio di Microsoft R Server è chiaro che non è più possibile evitare di parlare di “R” uno dei linguaggi della Data Science più di moda del momento. La prima cosa necessaria da fare è quindi capire da dove partire per fare proprio questo linguaggio, indipendentemente dal fatto che siate o vogliate essere Data Scientists, dato che è un linguaggio estremamente potente e sarà presente ovunque nel mondo dei dati, e quindi diventa un bagaglio culturale importante da portare con se.