Settembre è sempre un mese difficile, ma #SemanticSEOWut anche se con fatica arriva alla sua 10° puntata. Continuiamo sull’onda del momento parlando prevalentemente di estrazione dei dati.
#1 Sull’estrazione delle entità
Nel post della serie SEO Semantica della settimana scorsa abbiamo parlato e incluso tanti documenti relativi all’estrazione di entità e questa settimana Bill Slawski ha continuato a condividere articoli sull’argomento.
I due articoli della settimana sono:
- Extracting Facts for Entities from Sources such as Wikipedia Titles and Infoboxes
- Looking at Peer Document Titles and Anchor Text when Collecting Facts about an Entity
#2 Stato dell’adozione delle best practice su linked data
Barbara Starr ha condiviso qualcosa di non nuovo, ma che vale la pena di condividere. Si tratta di “Adoption of Linked Data Best Practices in Different Topical Domains”
#3 Altri articoli accademici sull’estrazione
Come fa notare Giorgio sul forum sembra che Google abbia qualcosa da ridire sul tema Knowledge Vault, ma la realtà è che indipendentemente dal nome e dal metodo effettivamente utilizzato la direzione è già chiara da tempo.
Includo di seguito un altro documento che vale la pena leggere proveniente da questo interessante articolo.
e la presentazione che Google ha fatto al KDD 2014
Buone pratiche con i Big Data
Un ottimo articolo dedicato ai Marketer con tema Big Data. Si tratta di “Best Practice in Big Data: A Marketer’s Primer”. Una lettura molto utile e comprensibile.