<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>Posts on Dataengineervictor</title>
        <link>https://dataengineervictor.com/posts/</link>
        <description>Recent content in Posts on Dataengineervictor</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>pt-br</language>
        <lastBuildDate>Wed, 11 Mar 2026 12:32:35 +0000</lastBuildDate><atom:link href="https://dataengineervictor.com/posts/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>O que é um Data Lake?</title>
        <link>https://dataengineervictor.com/posts/2026/03/11/data-lake/</link>
        <pubDate>Wed, 11 Mar 2026 12:32:35 +0000</pubDate>
        
        <guid>https://dataengineervictor.com/posts/2026/03/11/data-lake/</guid>
        <description>&lt;p&gt;Oi gente. Hoje vou falar sobre Data Lake.&lt;/p&gt;
&lt;h3 id=&#34;data-lake&#34;&gt;Data Lake
&lt;/h3&gt;&lt;p&gt;Um Data Lake é um repositório que os dados de várias fontes diferentes são reunidos e armazenados em um sistema lógico. Ele permite armazenar todos os seus dados estruturados, semi-estruturados e não estruturados em qualquer escala. Você pode armazenar seus dados como estão, sem precisar primeiro estruturá-los.&lt;/p&gt;
&lt;h3 id=&#34;por-que-o-conceito-de-data-lake-foi-criado&#34;&gt;Por que o conceito de Data Lake foi criado?
&lt;/h3&gt;&lt;p&gt;Antes do Data Lake, as organizações dependiam de banco de dados relacionais e data warehouses para gerenciar seus dados. O problema é que eles eram feitas principalmente para dados estruturados.&lt;/p&gt;
&lt;p&gt;Com o crescimento da internet, e principalmente pela chegada das redes sociais e do streaming de mídia, as organizações passaram a lidar com uma grande quantidade de dados não estruturados, como textos &lt;strong&gt;livres&lt;/strong&gt; e &lt;strong&gt;imagens&lt;/strong&gt;. Porém, os data warehouses e banco de dados relacionais não estavam preparados para lidar com esse aumento de dados, devido aos seus esquemas rígidos e aos custos de armazenamento relativamente altos.&lt;/p&gt;
&lt;p&gt;Com isso em vista, foi criado o conceito de Data Lake.&lt;/p&gt;
</description>
        </item>
        <item>
        <title>Diferença entre dados estruturados, não estruturados e semi-estruturados</title>
        <link>https://dataengineervictor.com/posts/2026/03/10/diferentes-tipos-de-dados/</link>
        <pubDate>Tue, 10 Mar 2026 12:35:44 +0000</pubDate>
        
        <guid>https://dataengineervictor.com/posts/2026/03/10/diferentes-tipos-de-dados/</guid>
        <description>&lt;p&gt;Olá pessoal. No meu dia a dia já lidei com diversos tipos de dados e vou aproveitar para definir aqui alguns deles e usar como referência caso eu queira revisar.&lt;/p&gt;
&lt;p&gt;Uma forma comum de classificar dados é de acordo com sua estrutura. Nessa classificação existem três tipos principais:&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Dados estruturados&lt;/li&gt;
&lt;li&gt;Dados não estruturados&lt;/li&gt;
&lt;li&gt;Dados semi-estruturados&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;É muito importante saber com que tipo de dados você está lidando. Cada um tem uma abordagem diferente. Abaixo vou colocar a definição deles.&lt;/p&gt;
&lt;hr&gt;
&lt;h3 id=&#34;dados-estruturados&#34;&gt;Dados estruturados
&lt;/h3&gt;&lt;p&gt;Dados estruturados possuem formato rígido e organizado em tabelas, com linhas e colunas bem definidas.&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;id&lt;/th&gt;
          &lt;th&gt;nome&lt;/th&gt;
          &lt;th&gt;idade&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;1&lt;/td&gt;
          &lt;td&gt;Victor&lt;/td&gt;
          &lt;td&gt;24&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;2&lt;/td&gt;
          &lt;td&gt;Aline&lt;/td&gt;
          &lt;td&gt;28&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id=&#34;dados-semi-estruturados&#34;&gt;Dados semi-estruturados
&lt;/h3&gt;&lt;p&gt;Dados semi-estruturados não possuem tabelas rígidas, mas têm marcadores ou hierarquia que organizam parcialmente o conteúdo. Eles possuem uma estrutura (chaves e valores), mas não precisa seguir sempre o mesmo formato como uma tabela.&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-json&#34; data-lang=&#34;json&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;{
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;  &lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;nome&amp;#34;&lt;/span&gt;: &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;Victor&amp;#34;&lt;/span&gt;,
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;  &lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;idade&amp;#34;&lt;/span&gt;: &lt;span style=&#34;color:#ae81ff&#34;&gt;24&lt;/span&gt;,
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;  &lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;cidade&amp;#34;&lt;/span&gt;: &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;Rio de Janeiro&amp;#34;&lt;/span&gt;,
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;  &lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;compras&amp;#34;&lt;/span&gt;: [
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    {&lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;produto&amp;#34;&lt;/span&gt;: &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;Celular&amp;#34;&lt;/span&gt;, &lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;preco&amp;#34;&lt;/span&gt;: &lt;span style=&#34;color:#ae81ff&#34;&gt;2000&lt;/span&gt;},
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    {&lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;produto&amp;#34;&lt;/span&gt;: &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;Fone&amp;#34;&lt;/span&gt;, &lt;span style=&#34;color:#f92672&#34;&gt;&amp;#34;preco&amp;#34;&lt;/span&gt;: &lt;span style=&#34;color:#ae81ff&#34;&gt;200&lt;/span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;  ]
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id=&#34;dados-não-estruturados&#34;&gt;Dados não estruturados
&lt;/h3&gt;&lt;p&gt;Dados não estruturados não possuem formato ou organização definida. Por exemplo:&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Vídeos&lt;/li&gt;
&lt;li&gt;Imagens&lt;/li&gt;
&lt;li&gt;Áudios&lt;/li&gt;
&lt;li&gt;Posts de redes sociais&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;Um email com o texto: &amp;ldquo;&lt;strong&gt;Olá, gostaria de saber o preço do notebook X e o prazo de entrega&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;Esse texto não possui campos definidos como uma tabela.&lt;/p&gt;
&lt;hr&gt;
</description>
        </item>
        <item>
        <title>Tipos de armazenamento de dados</title>
        <link>https://dataengineervictor.com/posts/2026/03/09/tipos-de-armazenamento-de-dados/</link>
        <pubDate>Mon, 09 Mar 2026 18:05:00 +0000</pubDate>
        
        <guid>https://dataengineervictor.com/posts/2026/03/09/tipos-de-armazenamento-de-dados/</guid>
        <description>&lt;p&gt;Não existe um armazenamento &amp;ldquo;perfeito&amp;rdquo; em Engenharia de Dados, mas sim um armazenamento que se adeque melhor a cada caso.&lt;/p&gt;
&lt;p&gt;A escolha do local de armazenamento de dados depende de três fatores principais: &lt;strong&gt;tipo de dados&lt;/strong&gt;, &lt;strong&gt;padrão de acesso&lt;/strong&gt; e &lt;strong&gt;custo/desempenho esperado&lt;/strong&gt;.&lt;/p&gt;
&lt;p&gt;Cada característica do dado impõe restrições técnicas na escolha do sistema de armazenamento. Algumas perguntas principais para definir onde irá armazenar os dados:&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Os dados são estruturados, semi-estruturados ou não estruturados?&lt;/li&gt;
&lt;li&gt;O uso principal é transacional ou analítico?&lt;/li&gt;
&lt;li&gt;Qual o volume de dados?&lt;/li&gt;
&lt;li&gt;Qual é a frequência de escrita/leitura?&lt;/li&gt;
&lt;li&gt;Existe necessidade de latência baixa ou processamento em lote?&lt;/li&gt;
&lt;li&gt;Os dados são históricos ou operacionais em tempo real?&lt;/li&gt;
&lt;li&gt;Qual custo aceitável de armazenamento?&lt;/li&gt;
&lt;/ol&gt;
</description>
        </item>
        <item>
        <title></title>
        <link>https://dataengineervictor.com/posts/anota%C3%A7%C3%B5es_estudo_dbt_11/03/2026/</link>
        <pubDate>Mon, 01 Jan 0001 00:00:00 +0000</pubDate>
        
        <guid>https://dataengineervictor.com/posts/anota%C3%A7%C3%B5es_estudo_dbt_11/03/2026/</guid>
        <description>&lt;p&gt;No blog do dbt labs tem um post do David Tishgart dizendo sobre o &lt;strong&gt;Paradoxo de Jevons&lt;/strong&gt;. Esse paradoxo diz que quando algo se torna mais eficiente ou barato, as pessoas tendem a usar mais, o que pode aumentar o consumo total.&lt;/p&gt;
&lt;p&gt;Ele diz que eles observam esse padrão no Dbt Labs. Também diz que muitas vezes rodam jobs que não alteram o modelo em nada, e mesmo assim continuam rodando.&lt;/p&gt;
&lt;p&gt;No posts,&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
