¿Cómo conseguir tu primer trabajo en Data Science?

¿Cómo se puede obtener su primer trabajo de nivel de entrada como Data Scientist o Data Analyst? Si se desplaza por los foros de ciencia de datos, encontrará muchas preguntas sobre este tema. Los lectores de mi blog de ciencia de datos (data36.com) me preguntan lo mismo de vez en cuando. ¡Y puedo decirte que es un problema totalmente válido!

¡He decidido resumir mis respuestas para todas las preguntas importantes!

¡NUEVO! Creé un video curso en línea completo (gratis) para ayudarlo a comenzar con Data Science. Haga clic aquí para obtener más información: Cómo convertirse en un científico de datos.

REGÍSTRESE AQUÍ (GRATIS): https://data36.com/how-to-become-a-data-scientist/

# 1: ¿Cuáles son las habilidades y herramientas más importantes del científico de datos? ¿Y cómo puedes conseguirlos?

Buenas noticias, malas noticias.

Comenzaré con el malo. En el 90% de los casos, las habilidades que te enseñan en las universidades no son realmente útiles en proyectos de ciencia de datos de la vida real. Como he escrito varias veces, en proyectos reales se necesitan estas 4 habilidades de codificación de datos:

  • bash / línea de comando
  • Pitón
  • SQL
  • R
  • (y a veces Java)
fuente: KDnuggets

Los 2 o 3 que encontrará más útiles realmente dependen de la empresa ... Pero si ha aprendido uno, será mucho más fácil aprender otro.

Entonces, la primera gran pregunta es: ¿cómo puede obtener estas herramientas? ¡Aquí vienen las buenas noticias! ¡Todas estas herramientas son gratis! Significa que puede descargarlos, instalarlos y usarlos sin pagar un centavo por ellos. ¡Puedes practicar, construir un proyecto de pasatiempo de datos o cualquier cosa!

Recientemente escribí un artículo paso a paso sobre cómo instalar estas herramientas en su computadora. Compruébalo aquí.

# 2: ¿Cómo aprender?

Hay 2 formas principales de aprender ciencia de datos de manera fácil y rentable.

1er: Libros.

Un poco de la vieja escuela, pero sigue siendo una buena forma de aprender. De los libros puede obtener un conocimiento muy detallado y detallado sobre análisis de datos en línea, estadísticas, codificación de datos, etc. Destaqué 7 libros que recomiendo en mi artículo anterior, aquí.

Los 7 mejores libros de datos que recomiendo

2do: seminarios web en línea y video cursos.

Los cursos en línea de ciencia de datos tienen precios justos ($ 10- $ 500) y cubren varios temas que van desde la codificación de datos hasta la inteligencia empresarial. Si no quiere gastar dinero en esto al principio, he enumerado cursos gratuitos y materiales de aprendizaje en esta publicación.

(3er: Curso del primer mes de Junior Data Scientist. He creado un curso en línea de ciencia de datos de 6 semanas para que los aspirantes a científicos de datos practiquen y resuelvan tareas reales en un conjunto de datos real: El primer mes de Junior Data Scientist .)

# 3: cómo practicar y cómo obtener experiencia de la vida real

Este es complicado, ¿verdad? Toda empresa quiere tener personas con al menos un poco de experiencia en la vida real ... Pero, ¿cómo se obtiene la experiencia en la vida real, si necesita experiencia en la vida real para obtener su primer trabajo? Clásico catch-22. Y la respuesta es: proyectos favoritos.

"Proyecto de mascota" significa que se te ocurre una idea de proyecto de datos que te entusiasma. Entonces simplemente comienzas a construirlo. Puede pensarlo como una pequeña startup, pero asegúrese de seguir centrándose en la parte de ciencia de datos del proyecto y simplemente puede ignorar la parte de negocios. Para darle algunas ideas, estos son algunos de mis proyectos favoritos de los últimos años:

  • Creé un script que supervisaba un sitio web de bienes raíces y me envió por correo electrónico las mejores ofertas en tiempo real, para poder obtener estas ofertas antes que los demás.
  • Creé un guión que extraía todos los artículos de ABC, BBC y CNN y, según las palabras utilizadas, conecté los artículos que trataban exactamente sobre el mismo tema en los 3 portales de noticias diferentes.
  • Construí un chatbot de autoaprendizaje en Python. (Sin embargo, no es demasiado inteligente, ya que aún no lo he entrenado).

¡Ser creativo! ¡Encuentre un proyecto de mascotas relacionado con la ciencia de datos para usted y comience a codificar! Si golpea la pared con un problema de codificación, que puede suceder fácilmente, cuando comienza a aprender un nuevo lenguaje de datos, simplemente use google y / o stackoverflow. Un breve ejemplo mío: sobre cuán efectivo es stackoverflow:

lado izquierdo: mi pregunta - lado derecho: la respuesta (en 7 minutos)

¡Observe la marca de tiempo! Envié una especie de pregunta complicada y recibí la respuesta en 7 minutos. Lo único que tenía que hacer era copiar y pegar el código en mi código de producción y boom, ¡simplemente funcionó!

(Nota: Cross Validated es otro gran foro para preguntas relacionadas con Data Science).

+1 sugerencia:

Incluso si es un poco difícil, trata de conseguir un mentor. Si tiene la suerte, encontrará a alguien que trabaja en el rol de Científico de Datos en una buena compañía y que puede pasar 1 hora semanal o quincenal con usted y discutir o enseñar cosas.

# 4: ¿Dónde y cómo envía su primera solicitud de empleo?

Si no ha logrado encontrar un mentor, aún puede encontrar el primero en su primera empresa. Este será su primer trabajo relacionado con la ciencia de datos, por lo que le sugiero que no se concentre en grandes sumas de dinero o en una atmósfera de inicio súper elegante. Concéntrese en encontrar un entorno donde pueda aprender y mejorar usted mismo.

Tomar su primer trabajo de ciencia de datos en una empresa multinacional podría no alinearse con esta idea, porque las personas allí generalmente están demasiado ocupadas con sus cosas, por lo que no tendrán tiempo ni motivación para ayudarlo a mejorar (por supuesto, siempre hay excepciones).

Comenzar en una pequeña startup como primera persona de datos en el equipo tampoco es una buena idea en su caso, porque estas compañías no tienen personas de datos de las que puedan aprender.

Le aconsejo que se concentre en 50 a 500 empresas de tamaño. Esa es la media dorada. Los científicos superiores de datos están a bordo, pero no están demasiado ocupados para ayudarlo y enseñarle.

Bien, has encontrado algunas buenas compañías ... ¿Cómo presentar una solicitud? Algunos principios para su CV: resalte sus habilidades y proyectos, no su experiencia (ya que todavía no tiene muchos años para poner en papel). Enumere los lenguajes de codificación relevantes (SQL y Python) que usa y vincule algunos de sus repositorios de github relacionados, para que pueda demostrar que realmente ha usado ese lenguaje.

Además, en la mayoría de los casos, las empresas solicitan una carta de presentación. Es una buena oportunidad para expresar su entusiasmo, por supuesto, pero también puede agregar algunos detalles prácticos, como lo que haría en sus primeras semanas si fuera contratado. (Por ejemplo, "Al observar su flujo de registro, supongo que la página web ____ juega un papel importante. En mis primeras semanas, realizaría ___, ___ y ​​___ (análisis específicos) para probar esta hipótesis y comprenderla más profundamente. Podría ayudar a la compañía a mejorar _____ y ​​eventualmente impulsar los _____ KPIs ".

Espero que esto le permita obtener una entrevista de trabajo, donde puede conversar un poco sobre sus proyectos favoritos, sus sugerencias de cartas de presentación, pero se tratará principalmente de verificación de ajuste de personalidad y, probablemente, de algunas pruebas de habilidades básicas. Si has practicado lo suficiente, pasarás esto ... pero si eres un tipo nervioso y quieres practicar más, puedes hacerlo en hackerrank.com.

Conclusión

Bueno, eso es todo. Sé que suena más fácil cuando está escrito, pero si realmente estás decidido a ser un Científico de Datos, ¡no será ningún problema hacerlo realidad! ¡Buena suerte con eso!

Si quieres probar cómo es ser un científico de datos junior en una startup realista, echa un vistazo a mi curso de 6 semanas en línea de ciencia de datos: ¡El primer mes del científico de datos junior!

Y si desea obtener más información sobre ciencia de datos, consulte mi blog (data36.com) y / o suscríbase a mi boletín informativo. ¡Y no se pierda mi nueva serie de tutoriales de codificación: SQL para análisis de datos!

¡Gracias por leer!

¿Te gustó el artículo? Solo házmelo saber haciendo clic en the a continuación. ¡También ayuda a otras personas a ver la historia!

Tomi Mester autor de data36.com Twitter: @ data36_com