Preparazione per l’esame Google Cloud Professional Data Engineer

Suggerimenti e trucchi dall'esperienza personale, seguiti da un elenco di materiali di studio

Ciao! Devi essere interessato a superare l’esame Google Cloud Professional Data Engineer. Google consiglia di avere 3+ anni di esperienza prima di tentare l’esame. Tuttavia, penso che se hai una certa esperienza con altri fornitori di cloud, database e SQL, puoi ancora farlo, vale a dire perché GCP è molto più intuitivo dei suoi concorrenti (a mio modesto parere).

A differenza di altre certificazioni, non esiste un libro di testo irreggimentato o un manuale di formazione. Questo perché Google si aspetta che tu sia un praticante e sappia la maggior parte delle cose per esperienza. Ma, realisticamente parlando, è molto difficile ottenere esposizione a tutti i prodotti e servizi. Così ho deciso di scrivere questo articolo e consegnare alcuni dei miei insegnamenti che mi hanno aiutato a superare l’esame. Se c’è qualcosa che pensi che mi sia sfuggito o che abbia sbagliato, per favore lascia un commento e cercherò di risolverlo.

Ho sostenuto l’esame a dicembre 2020 e l’ho superato al mio primo tentativo dopo aver trascorso circa 30 ore in tempo di preparazione.

L'esame

Ecco cosa vi aspetta:

  • 2 ore
  • 50 domande
  • 4 risposte per domanda
  • L’unica risposta corretta, ad eccezione di circa 5-6 domande che richiedono due risposte
  • Puoi segnalare le domande per la revisione in un secondo momento
  • In grado di tornare a qualsiasi  domanda in qualsiasi momento
  • Valido per 2 anni
  • Quando fai clic su “Fine”, otterrai un risultato immediato: un passaggio o un fallimento.  Non c’è  punteggio o spiegazione.

 

Suggerimenti per l'esame

Due delle risposte che puoi scartare subito

Ad esempio, guarda la domanda qui sotto. Hai due risposte che specificano BigQuery e due per Cloud Storage. E metà di questi menziona Dataflow e l’altra metà, Dataproc.

Esempio di domanda dal materiale di formazione ufficiale

In domande come questa dovrebbe essere facile scartare l’opzione meno praticabile (Cloud Storage, perché il requisito richiede query SQL) e quindi concentrarsi sulla scelta tra Dataflow o Dataproc.

Anche se non conosci la risposta esatta, è possibile portare le tue possibilità a 50/50.

Leggi le domande MOLTO attentamente.

Una volta rimosse le risposte improbabili, spesso ti rimangono due opzioni che sembrano ugualmente plausibili. Come illustrato nell’esempio precedente, è necessario scegliere tra Dataflow o Dataproc.  Se hai prestato molta attenzione, avrai notato che la risposta corretta è Dataproc perché menzionano  i lavori Spark personalizzati.

La risposta corretta spesso dipende da una singola parola o frase. Quindi leggi MOLTO attentamente.

Prodotti Google su open source

Probabilmente lo sai già, ma le risposte corrette in questo esame sono quasi sempre quelle che implicano una più profonda integrazione con GCP. Guarda la domanda qui sotto. Ti chiede di scegliere tra Pub / Sub e Kafka. Non dovrebbe sorprendere che l’opzione corretta sia la prima.

Esempio di domanda dal materiale di formazione ufficiale

Le domande pratiche sono la chiave per passare

Col senno di poi, il metodo più efficiente (per me) era quello di esaminare le domande di esempio e poi raddoppiare le risposte errate. Se non sei un principiante GCP completo, questo ti farà risparmiare un sacco di tempo e ti aiuterà a pescare le aree su cui devi migliorare.

Materiali didattici

Ci sono alcuni corsi a pagamento là fuori, e puoi trovare l’elenco in fondo. Tuttavia, ho trovato nessuno di loro vale i soldi o il tempo. Sembravano troppo semplici e mirati ai principianti, persone che non hanno quasi nessuna esperienza con piattaforme cloud, database o modelli ML. Ho dovuto ricorrere all’ascolto a velocità 2x o semplicemente sfogliare le trascrizioni. Per non parlare del fatto che alcuni di essi sono stati creati pensando al vecchio esame (pre-aprile 2019).

Ho un sentimento simile nei confronti di Qwiklabs (potresti sperimentarli se ti iscrivi a uno qualsiasi dei corsi Coursera, o puoi persino iscriverti direttamente a loro). Se sei nuovo in GCP e negli ambienti cloud in generale, possono essere un ottimo trampolino di lancio. Ma nel mio caso, non credo che mi abbiano insegnato nulla di utile per l’esame. La maggior parte dei laboratori sembrava un fantasioso esercizio di copia-incolla. E nei progetti di produzione, non usiamo quasi mai la Cloud Console, ma Terraform e Cloud Deployment Manager (nessun problema, quelli non sono trattati nell’esame).

Preparazione per l’esame Google Cloud Professional Data Engineer

A mio parere, questo è l’unico corso che dovresti seguire. È guidato dal ragazzo che effettivamente fa gli esami GCP. Il corso non ti  insegnerà quali  sono le risposte, ma ti darà un’idea più pratica di come saranno le domande. Ci sono una discreta quantità di domande di esempio, seguite da spiegazioni dettagliate (qualcosa che è stato abbastanza difficile da trovare). Mi sono iscritto alla prova di 7 giorni e ho finito il corso in 2-3 pomeriggi, quindi ho annullato il mio abbonamento.

Il dossier dati

Quanto sopra è un ottimo cheat-sheet, disponibile gratuitamente. L’ho incontrato quando ho fatto il corso Linux Academy (vedi ‘Risorse a pagamento’ di seguito). Altamente raccomandato.

https://github.com/ml874/Data-Engineering-on-GCP-Cheatsheet

Un altro cheat-sheet disponibile su Github. Un po ‘obsoleto, ma ancora abbastanza utile.

 

Preparing For The Google Cloud Professional Data Engineer Exam | by Ivan N. | Datasparq Technology | Medium

Articolo di Ivan N.

 

 

Share:

Contenuti
Torna in alto