IT認定試験資料
https://blog.dumpleader.com/ja/2022/12/10/グーグルプロフェッショナルデータエンジニア試/
Export date: Fri Jan 31 8:08:42 2025 / +0000 GMT

Google Professional-Data-Engineer試験問題&解答集[Q75-Q99]を無料で準備する究極のガイド




Google Professional-Data-Engineer試験の問題と回答を無料で準備する究極のガイド

Google Professional-Data-Engineerテストエンジンpdfに合格 - すべての無料ダンプツ


Googleプロフェッショナル・データ・エンジニア試験の機能的・技術的側面の理解 データ処理システムの構築と運用

ここでは、以下について説明する:

  • パイプラインの監視
  • ストレージ・コストとパフォーマンス
  • 加工インフラの構築と運用
  • マイグレーションの検証
  • トランスフォーメーション
  • データの取得とインポート
  • リソースの提供
  • バッチとストリーミング
  • 新しいデータソースとの統合
  • データ処理システムの構築と運用
  • 試験と品質管理
  • データのライフサイクル管理
  • ストレージシステムの構築と運用
  • マネージドサービスの有効活用(Cloud Bigtable、Cloud Spanner、Cloud SQL、BigQuery、Cloud Storage、Cloud Datastore、Cloud Memorystore)
  • パイプラインの調整
  • パイプラインの構築と運用
  • 現在の状態を認識し、デザインを将来の状態に移行させる方法。

Googleプロフェッショナルデータエンジニア試験の機能的、技術的側面の理解 ソリューション品質の確保

ここでは、以下について説明する:

  • 検証とモニタリング
  • 拡張性と効率性の確保
  • プライバシーの確保(データ損失防止APIなど)
  • リソースのサイズ変更とオートスケール
  • データとアプリケーションの移植性を考慮した設計(マルチクラウド、データレジデンシー要件など)
  • データ・セキュリティ(暗号化、鍵管理)
  • ACID、idempotent、最終的に一貫性のある要件の選択
  • パイプラインのモニタリング(Stackdriverなど)
  • 信頼性と忠実性の確保
  • 法令遵守(医療保険の相互運用性と説明責任に関する法律(HIPAA)、児童オンラインプライバシー保護法(COPPA)、FedRAMP、一般データ保護規則(GDPR)など)
  • 柔軟性と移植性の確保

 

Q75. あなたは画像認識領域のニッチ製品に取り組んでいます。あなたのチームは、あなたのチームが実装したカスタムC++ TensorFlowオペによって支配されるモデルを開発しました。これらのopsはメインの学習ループ内で使用され、大量の行列乗算を実行しています。現在、モデルのトレーニングには数日かかっています。Google Cloud上のアクセラレータを使用することで、この時間を大幅に短縮し、コストを抑えたいと考えています。どうすればいいでしょうか?

 
 
 
 

Q76. あなたの会社では、WHILECARDテーブルを使用して、似た名前の複数のテーブルにまたがるデータを照会しています。SQL文は現在、以下のエラーで失敗しています:
# 構文エラー :4:11] SELECT age FROM bigquery-public-data.noaa_gsod.gsod WHERE age != 99 AND_TABLE_SUFFIX = `1929′ ORDER BY age DESC SQL文が正しく動作するテーブル名は?

 
 
 
 

Q77. Google Cloud上の10TBデータベースの一部である2つのリレーショナルテーブルのストレージを設計しています。水平方向にスケールするトランザクションをサポートしたい。また、非キー列の範囲クエリ用にデータを最適化したい。何をすべきでしょうか?

 
 
 
 

Q78. あなたの会社の経営者から、銀行取引のデータベースを渡された。各行には
ユーザーID、取引タイプ、取引場所、取引金額。彼らは、以下のことを調査するよう求める。
そのデータに機械学習を適用できる。あなたはどの3つの機械学習を適用できますか?
を使いますか?

 
 
 
 
 
 

Q79. 現在のオンプレミスのApache Hadoopデプロイメントをクラウドに移行する予定です。長時間稼働するバッチジョブに対して、可能な限りフォールトトレラントでコスト効率の高いデプロイメントを確保する必要があります。マネージドサービスを利用したいと考えています。どうすればよいでしょうか。

 
 
 
 

Q80. レガシーSQLと標準SQLに関する次の記述のうち、正しくないものはどれですか?

 
 
 
 

Q81. BigQueryで非正規化データ構造を使用するメリットは2つありますか?

 
 
 
 

Q82. なぜ機械学習のデータセットを学習データとテストデータに分ける必要があるのか?

 
 
 
 

Q83. Cloud Bigtableのための_________________は、Cloud BigtableをCloud Dataflowパイプラインで使用することを可能にします。

 
 
 
 

Q84. あなたは、組織サンプルに関する情報のデータベースを使用して、将来の組織サンプルを正常か変異のいずれかに分類したい。あなたは、組織標本を分類するための教師なし異常検出法を評価しています。この方法をサポートする2つの特徴はどれか?(2つ選べ)

 
 
 
 
 

Q85. BigQueryテーブルをデータシンクとして使用したい。どの書き込みモードでBigQueryをシンクとして使用できますか?

 
 
 
 

Q86. 金融サービス企業がクラウド・テクノロジーに移行し、50TBの金融時系列データをクラウドに保存しようとしている。このデータは頻繁に更新され、常に新しいデータが流れ込んでくる。また、既存のApache Hadoopジョブをクラウドに移行し、このデータに対する洞察を得たいと考えています。
データの保存にはどの製品を使うべきか?

 
 
 
 

Q87. 次のうち、Dataflowがサポートする3つの主要なトリガーの1つではないものはどれですか?

 
 
 
 

Q88. あなたは、不動産物件を含む利用可能なデータセットに基づいて、住宅価格を予測するモデルをトレーニングしている。
あなたの計画は完全連結ニューラルネットを訓練することであり、データセットに物件の緯度と経度が含まれていることを発見した。不動産の専門家は、物件の立地が価格に大きく影響すると言っているので、あなたはこの物理的な依存関係を組み込んだ機能を設計したい。
どうするべきか?

 
 
 
 

Q89. あなたはある運送会社に勤めている。その会社では配送センターがあり、荷物は適切な経路をたどるために配送ライン上を移動する。同社は、配送ラインにカメラを追加し、輸送中の荷物の視覚的な損傷を検出して追跡したいと考えています。あなたは、破損した荷物の検出を自動化し、荷物の輸送中にリアルタイムで人間が確認するためのフラグを立てる方法を作成する必要があります。どのソリューションを選択すべきでしょうか?

 
 
 
 

Q90. あなたは、3つのクリニックの数百人の患者をカバーする試験的プロジェクトとして、患者記録のデータベースを設計しました。
あなたの設計では、すべての患者とその訪問を表すために単一のデータベーステーブルを使用し、レポートを生成するために自己結合を使用しました。サーバリソースの使用率は 50% でした。その後、プロジェクトの範囲が拡大しました。
データベースには100倍の患者記録を保存しなければならなくなりました。時間がかかりすぎるか、計算リソースが不足してエラーが発生するため、レポートを実行できなくなりました。データベース設計をどのように調整すべきでしょうか?

 
 
 
 

Q91. Cloud Pub/Subトピックからメッセージを受信し、EUのBigQueryデータセットに結果を書き込むパイプラインをCloud Dataflowで実行しています。現在、パイプラインはeurope-west4に配置され、最大3ワーカー、インスタンスタイプn1-standard-1を持っています。ピーク時には、3人のワーカーすべてのCPU使用率が最大になり、パイプラインがタイムリーにレコードを処理するのに苦労していることに気づきます。パイプラインのパフォーマンスを向上させるために、どの2つのアクションを取ることができますか?(2つ選んでください)。

 
 
 
 
 

Q92. 御社のオンプレミスのApache Hadoopサーバーが耐用年数を迎え、IT部門はクラスタをGoogle Cloud Dataprocに移行することを決定しました。クラスターを同程度に移行するには、ノードあたり50TBのGoogle Persistent Diskが必要になる。CIOは、それだけのブロックストレージを使用するコストを懸念している。
移行にかかるストレージコストを最小限に抑えたい。どうすればいいでしょうか?

 
 
 
 

Q93. あなたの天気アプリは15分ごとにデータベースに問い合わせ、現在の気温を取得します。フロントエンドはGoogle App Engineで動作し、数百万人のユーザーをサーバーに収容しています。データベースの障害に対応するために、フロントエンドをどのように設計すべきでしょうか?

 
 
 
 

Q94. Cloud Bigtableノードに障害が発生すると、___が失われる。

 
 
 
 

Q95. Bigtableクラスタの特定のノードで、読み書きの回数が不均衡になりやすい行キーはどれですか(答えを2つ選んでください)。

 
 
 
 

Q96. GoogleのDataflow SDKを使用して、以下のような顧客データを分析する予定です。プロジェクトの要件は、データソースから顧客名のみを抽出し、出力PCollectionに書き出すことです。
トム555 Xストリート
ティム553 Y通り
サム、111 Zストリート
上記のデータ処理要件に最も適したオペレーションはどれか?

 
 
 
 

Q97. Bigtableクラスタの特定のノードで、読み書きの回数が不均衡になりやすい行キーはどれですか(答えを2つ選んでください)。

 
 
 
 

Q98. あなたは広告会社に勤めており、広告ブロックのクリックスルー率を予測するSpark MLモデルを開発しました。これまですべてオンプレミスのデータセンターで開発していましたが、Google Cloudに移行することになりました。データセンターはBigQueryに移行します。Spark MLモデルを定期的に再トレーニングするため、既存のトレーニングパイプラインをGoogle Cloudに移行する必要があります。どうすればいいでしょうか?

 
 
 
 

Q99. カンマ区切り値(CSV)ファイルからGoogle.co.jpにデータを読み込むのに数日を費やした。
BigQueryのCLICK_STREAMテーブル。カラムDTにはクリックイベントのエポックタイムが格納されます。便宜上
では、すべてのフィールドがSTRING型として扱われる単純なスキーマを選びました。では
あなたのサイトを訪問したユーザーのウェブ・セッションの継続時間。
TIMESTAMP。将来のクエリを計算負荷の高いものにすることなく、移行の労力を最小限に抑えたい。
高い。どうするべきか?

 
 
 
 
 

詳細な解説付きのオンライン模擬試験! https://www.dumpleader.com/Professional-Data-Engineer_exam.html 1

リンク
  1. https://www.dumpleader.com/Professional-Data-Engin eer_exam.html
投稿日時: 2022-12-10 11:57:25
投稿日時 GMT: 2022-12-10 11:57:25

投稿日時: 2022-12-10 11:57:25
投稿日時 GMT: 2022-12-10 11:57:25

Export date: Fri Jan 31 8:08:42 2025 / +0000 GMT
このページはIT認定試験資料からエクスポートしたものです。 [ http://blog.dumpleader.com ]