이 페이지는 IT 인증 시험 자료에서 내보낸 것입니다. [ http://blog.dumpleader.com ]
Export date: Fri Jan 31 9:01:36 2025 / +0000 GMT

무료 Google 전문가-데이터 엔지니어 시험 문제 및 답변 [Q75-Q99] 준비를 위한 궁극의 가이드




무료 Google 전문가-데이터 엔지니어 시험 문제 및 답변 준비를 위한 궁극의 가이드

합격 구글 전문가-데이터 엔지니어 테스트 엔진 pdf - 모든 무료 덤프


Google 전문 데이터 엔지니어 시험의 기능적 및 기술적 측면 이해 데이터 처리 시스템 구축 및 운영

여기서 설명하는 내용은 다음과 같습니다:

  • 파이프라인 모니터링
  • 스토리지 비용 및 성능
  • 처리 인프라 구축 및 운영
  • 마이그레이션 유효성 검사
  • 변환
  • 데이터 수집 및 가져오기
  • 리소스 프로비저닝
  • 배치 및 스트리밍
  • 새로운 데이터 원본과 통합
  • 데이터 처리 시스템 구축 및 운영
  • 테스트 및 품질 관리
  • 데이터의 수명 주기 관리
  • 스토리지 시스템 구축 및 운영
  • 관리형 서비스(Cloud Bigtable, Cloud Spanner, Cloud SQL, BigQuery, Cloud Storage, Cloud Datastore, Cloud Memorystore)의 효과적인 사용
  • 파이프라인 조정
  • 파이프라인 구축 및 운영
  • 현재 상태에 대한 인식 및 디자인을 미래 상태로 마이그레이션하는 방법

Google 전문 데이터 엔지니어 시험의 기능적, 기술적 측면 이해 솔루션 품질 보장하기

여기서 설명하는 내용은 다음과 같습니다:

  • 확인 및 모니터링
  • 확장성 및 효율성 보장
  • 개인정보 보호 보장(예: 데이터 손실 방지 API)
  • 리소스 크기 조정 및 자동 확장
  • 데이터 및 애플리케이션 이동성을 위한 설계(예: 멀티 클라우드, 데이터 상주 요구 사항)
  • 데이터 보안(암호화, 키 관리)
  • 산성, 무력, 궁극적으로 일관된 요구 사항 중에서 선택
  • 파이프라인 모니터링(예: 스택드라이버)
  • 신뢰성 및 충실성 보장
  • 법률 준수(예: 의료정보 이동 및 책임에 관한 법률(HIPAA), 아동 온라인 개인정보 보호법(COPPA), FedRAMP, 일반 데이터 보호 규정(GDPR))
  • 유연성 및 휴대성 보장

 

Q75. 이미지 인식 영역에서 틈새 제품을 개발하고 있습니다. 팀에서 구현한 사용자 지정 C++ TensorFlow 연산이 지배하는 모델을 개발했습니다. 이러한 연산은 기본 훈련 루프 내에서 사용되며 대용량 행렬 곱셈을 수행합니다. 현재 모델을 훈련하는 데 최대 며칠이 걸립니다. Google Cloud의 가속기를 사용하여 이 시간을 크게 단축하고 비용을 낮추고 싶습니다. 어떻게 해야 하나요?

 
 
 
 

Q76. 회사에서 WHILECARD 테이블을 사용하여 이름이 비슷한 여러 테이블의 데이터를 쿼리하고 있습니다. 현재 다음 오류와 함께 SQL 문이 실패하고 있습니다:
# 구문 오류 : 문 끝이 예상되었으나 [4:11]에서 "-"가 발생했습니다] SELECT age FROM bigquery-public-data.noaa_gsod.gsod WHERE age != 99 AND_TABLE_SUFFIX = `1929′ ORDER BY age DESC 어떤 테이블 이름이 SQL 문을 올바르게 작동시킬 수 있나요?

 
 
 
 

Q77. Google Cloud에서 10TB 데이터베이스의 일부인 두 개의 관계형 테이블을 위한 스토리지를 설계하고 있습니다. 수평으로 확장되는 트랜잭션을 지원하려고 합니다. 또한 키가 아닌 열에 대한 범위 쿼리를 위해 데이터를 최적화하려고 합니다. 어떻게 해야 할까요?

 
 
 
 

Q78. 회사의 비즈니스 소유자가 은행 거래 데이터베이스를 제공했습니다. 각 행에는
사용자 ID, 거래 유형, 거래 위치, 거래 금액 등입니다. 다음 사항을 조사하도록 요청합니다.
유형의 머신 러닝을 데이터에 적용할 수 있습니다. 어떤 세 가지 머신 러닝 애플리케이션을 사용할 수 있나요?
사용하시겠습니까? (3개 선택)

 
 
 
 
 
 

Q79. 현재 온프레미스 Apache Hadoop 배포를 클라우드로 마이그레이션할 계획입니다. 장기간 실행되는 배치 작업에 대해 배포가 가능한 한 내결함성 및 비용 효율적이어야 합니다. 관리형 서비스를 사용하려고 합니다. 어떻게 해야 하나요?

 
 
 
 

Q80. 다음 중 레거시 SQL 및 표준 SQL에 대한 설명 중 사실이 아닌 것은?

 
 
 
 

Q81. BigQuery에서 비정규화된 데이터 구조를 사용하면 어떤 두 가지 이점이 있나요?

 
 
 
 

Q82. 머신 러닝 데이터 세트를 학습 데이터와 테스트 데이터로 분리해야 하는 이유는 무엇인가요?

 
 
 
 

Q83. Cloud Bigtable용 _________ 을 사용하면 Cloud 데이터 흐름 파이프라인에서 Cloud Bigtable을 사용할 수 있습니다.

 
 
 
 

Q84. 조직 샘플에 대한 정보 데이터베이스를 사용하여 향후 조직 샘플을 정상 또는 돌연변이로 분류하려고 합니다. 조직 샘플을 분류하기 위한 비지도 이상 탐지 방법을 평가하고 있습니다. 이 방법을 지원하는 두 가지 특성은 무엇입니까? (두 가지를 선택하세요.)

 
 
 
 
 

Q85. BigQuery 테이블을 데이터 싱크로 사용하려고 합니다. 어떤 쓰기 모드에서 BigQuery를 싱크로 사용할 수 있나요?

 
 
 
 

Q86. 금융 서비스 회사가 클라우드 기술로 전환하면서 50TB의 금융 시계열 데이터를 클라우드에 저장하려고 합니다. 이 데이터는 자주 업데이트되며 새로운 데이터가 항상 스트리밍으로 들어옵니다. 또한 이 데이터에 대한 인사이트를 얻기 위해 기존 Apache Hadoop 작업을 클라우드로 옮기고자 합니다.
데이터를 저장하는 데 어떤 제품을 사용해야 하나요?

 
 
 
 

Q87. 다음 중 데이터플로우가 지원하는 세 가지 주요 트리거 유형 중 하나가 아닌 것은 무엇인가요?

 
 
 
 

Q88. 부동산 매물이 포함된 사용 가능한 데이터 집합을 기반으로 주택 가격을 예측하는 모델을 훈련하고 있습니다.
완전히 연결된 신경망을 훈련할 계획인데, 데이터 세트에 부동산의 위도와 경도가 포함되어 있다는 사실을 발견했습니다. 부동산 전문가로부터 부동산의 위치가 가격에 큰 영향을 미친다는 말을 들었으므로 이러한 물리적 의존성을 통합하는 기능을 설계하고 싶다고 가정해 보겠습니다.
어떻게 해야 하나요?

 
 
 
 

Q89. 배송을 위해 배송 라인에서 패키지를 이동시키는 물류 센터가 있는 배송 회사에서 일하고 있습니다. 이 회사는 배송 라인에 카메라를 추가하여 운송 중인 패키지의 시각적 손상을 감지하고 추적하고자 합니다. 패키지가 운송되는 동안 손상된 패키지를 자동으로 감지하고 사람이 실시간으로 검토할 수 있도록 플래그를 지정하는 방법을 만들어야 합니다. 어떤 솔루션을 선택해야 할까요?

 
 
 
 

Q90. 세 곳의 클리닉에서 수백 명의 환자를 대상으로 하는 파일럿 프로젝트로 환자 기록용 데이터베이스를 설계했습니다.
설계에서는 단일 데이터베이스 테이블을 사용하여 모든 환자와 환자의 방문을 나타내고, 자체 조인을 사용하여 보고서를 생성했습니다. 서버 리소스 사용률은 50%였습니다. 그 이후로 프로젝트의 범위가 확장되었습니다.
이제 데이터베이스에 100배 더 많은 환자 기록을 저장해야 합니다. 너무 오래 걸리거나 컴퓨팅 리소스가 부족하여 오류가 발생하여 더 이상 보고서를 실행할 수 없습니다. 데이터베이스 설계를 어떻게 조정해야 하나요?

 
 
 
 

Q91. Cloud Pub/Sub 토픽에서 메시지를 수신하고 그 결과를 EU의 BigQuery 데이터 집합에 쓰는 Cloud Dataflow에서 파이프라인을 실행하고 있습니다. 현재 파이프라인은 europe-west4에 있으며 최대 3개의 작업자가 있고 인스턴스 유형은 n1-standard-1입니다. 작업자 3명이 모두 최대 CPU 사용률을 사용하는 피크 기간 동안 파이프라인이 적시에 레코드를 처리하는 데 어려움을 겪고 있는 것을 발견했습니다. 파이프라인의 성능을 향상시키기 위해 취할 수 있는 두 가지 조치는 무엇인가요? (두 가지를 선택하세요.)

 
 
 
 
 

Q92. 회사의 온프레미스 Apache Hadoop 서버의 수명이 다가오고 있으며, IT 부서는 클러스터를 Google Cloud Dataproc으로 마이그레이션하기로 결정했습니다. 클러스터를 유사하게 마이그레이션하려면 노드당 50TB의 Google 퍼시스턴트 디스크가 필요합니다. CIO는 그렇게 많은 블록 스토리지를 사용하는 데 드는 비용이 걱정됩니다.
마이그레이션의 스토리지 비용을 최소화하고 싶습니다. 어떻게 해야 할까요?

 
 
 
 

Q93. 날씨 앱은 15분마다 데이터베이스를 쿼리하여 현재 기온을 가져옵니다. 프런트엔드는 Google 앱 엔진으로 구동되며 수백만 명의 사용자를 서버로 지원합니다. 데이터베이스 장애에 대응하기 위해 프론트엔드를 어떻게 설계해야 할까요?

 
 
 
 

Q94. 클라우드 빅테이블 노드에 장애가 발생하면 ____ 이 손실됩니다.

 
 
 
 

Q95. 빅테이블 클러스터의 특정 노드에서 불균형적인 수의 읽기 및/또는 쓰기를 유발할 가능성이 있는 행 키는 무엇입니까(답 2개 선택)?

 
 
 
 

Q96. 아래에 표시된 것과 같은 고객 데이터를 분석하기 위해 Google의 데이터 흐름 SDK를 사용하려고 합니다. 프로젝트 요구 사항은 데이터 소스에서 고객 이름만 추출한 다음 출력 PCollection에 쓰는 것입니다.
Tom,555 X 거리
팀, 553 Y 거리
샘, 111 Z 거리
위의 데이터 처리 요구 사항에 가장 적합한 작업은 무엇인가요?

 
 
 
 

Q97. 빅테이블 클러스터의 특정 노드에서 불균형적인 수의 읽기 및/또는 쓰기를 유발할 가능성이 있는 행 키는 무엇입니까(답 2개 선택)?

 
 
 
 

Q98. 광고 회사에서 근무하며 광고 블록에서 클릭률을 예측하는 Spark ML 모델을 개발했습니다. 온프레미스 데이터 센터에서 모든 것을 개발해 왔는데 이제 회사를 Google Cloud로 마이그레이션하려고 합니다. 데이터 센터가 BigQuery로 마이그레이션됩니다. 주기적으로 Spark ML 모델을 재학습하므로 기존 학습 파이프라인을 Google Cloud로 마이그레이션해야 합니다. 어떻게 해야 하나요?

 
 
 
 

Q99. 쉼표로 구분된 값(CSV) 파일에서 Google
빅쿼리 테이블 CLICK_STREAM. 열 DT는 클릭 이벤트의 에포크 시간을 저장합니다. 편의를 위해
에서 모든 필드가 문자열 유형으로 처리되는 간단한 스키마를 선택했습니다. 이제 다음을 계산하려고 합니다.
사이트를 방문하는 사용자의 웹 세션 지속 시간을 측정하고 해당 데이터 유형을
타임스탬프. 향후 쿼리를 계산적으로 수행하지 않고 마이그레이션 작업을 최소화하려는 경우
비싸다. 어떻게 해야 하나요?