Ruggiero Dargenio,瑞士z<e:1>里奇的开发者
Ruggiero is available for hire
Hire Ruggiero

Ruggiero Dargenio

Verified Expert  in Engineering

大数据工程师和开发人员

Location
Zürich, Switzerland
Toptal Member Since
July 12, 2022

Ruggiero是一个拥有超过五年数据工程经验的真实世界数据专家, 为NLP和网络安全领域的各种用例开发模型. 拥有软件工程背景和苏黎世联邦理工学院和麻省理工学院的计算机科学硕士学位, 他已经编码超过15年了. Ruggiero还擅长为不同的金融机构创建基于大数据技术的管道和ETL转换.

Portfolio

Duenders LLC
谷歌云平台(GCP),自然语言处理(NLP)...
Deloitte
Python, PySpark, Foundry, Pandas, SQL, Rundeck, Jira,数据可视化...
Credit Suisse
Python, PySpark, Scikit-learn, SQL, Pandas, Jira,数据科学,数据管道...

Experience

Availability

Part-time

Preferred Environment

Machine Learning, Data Engineering, Scikit-learn, Pandas, PySpark, TensorFlow, PyTorch, Docker, SQL, Python

The most amazing...

...我开发了一个端到端的机器学习解决方案,用于网络威胁检测.

Work Experience

Lead Data Scientist

2021 - PRESENT
Duenders LLC
  • 开发了一种基于吉娜和变形金刚嵌入的神经搜索.
  • 部署在云上的无服务器容器按照特定的时间表运行.
  • 监督金融科技领域的网络和移动应用程序的开发.
Technologies: 谷歌云平台(GCP),自然语言处理(NLP), 生成预训练变压器(GPT), GPT, Docker, Large Language Models (LLMs), Artificial Intelligence (AI), Amazon Web Services (AWS), Amazon Machine Learning, Amazon S3 (AWS S3), Snowflake

Big Data Engineer

2021 - PRESENT
Deloitte
  • 致力于全公司范围的解决方案,以拥有来自多个来源的数据的客户的独特视图.
  • 构建ETL管道,使用基于Palantir Foundry的大数据技术从各种数据库系统中提取和摄取数据.
  • 开发并测试了为数据湖提供提要的数据源及其在生产环境中的部署.
  • 通过将业务逻辑与消费者需求集成来设计管道规范.
  • 与项目经理和业务分析师沟通,优化数据管道的效率.
Technologies: Python, PySpark, Foundry, Pandas, SQL, Rundeck, Jira,数据可视化, Data Engineering, Data Science, Data Pipelines, Data Modeling, Spark SQL, Spark, Artificial Intelligence (AI)

Data Modeler

2020 - 2021
Credit Suisse
  • 作为承包商参与建模和分析不同的财务数据,以识别洗钱活动.
  • 在由多达10名开发人员和业务分析师组成的敏捷工作流中担任产品负责人. 确定业务需求并确定其优先级, 然后将它们转换为技术实现任务.
  • 分析了以可解释性为重点开发的机器学习模型.
  • 确保模型技术性能指标反映了业务用例.
  • 使用基于Spark集群的最先进的大数据技术对客户的交易行为进行临时分析,以检测洗钱模式.
  • 提出并参与实施项目范围战略, productionalization, 以及部署后对ML模型的监控.
  • 代表团队讨论与外部数据提供者的合作.
Technologies: Python, PySpark, Scikit-learn, SQL, Pandas, Jira,数据科学,数据管道, Spark SQL, Spark, Artificial Intelligence (AI)

Data Scientist

2018 - 2020
BIS——国际清算银行
  • 开发端到端系统,识别各种网络威胁和恶意行为.
  • 构建基于npl的检测模型-垃圾邮件分类器构建在BERT之上,使用PyTorch实现, scikit-learn安全事件响应平台中网络警报的优先级模型, 以及用于处理命令行的异常检测器.
  • 开发了基于网络流量的检测模型, targeting DNS tunneling, admin access traffic, and malicious domains. 数据处理使用PySpark, ML模型使用MLlib.
  • 与团队合作开发基于Apache和Cloudera产品的BIS大数据平台. 收集硬件需求,选择软件工具,并定义用例.
Technologies: Python, PySpark, Scikit-learn, Pandas, MLlib, TensorFlow, PyTorch, SQL, Data Science, Spark SQL, Spark, Language Models, Text Generation, Large Language Models (LLMs), Artificial Intelligence (AI)

Purse

这是一款创新的优惠券移动应用程序,它使用开放式银行服务来根据客户的特定兴趣定制折扣. 该系统将根据用户的支出推荐优惠券,以提供有效的有针对性的版税计划.

Languages

SQL, Python, Snowflake

Frameworks

Spark

Libraries/APIs

Scikit-learn, Pandas, PySpark, TensorFlow, PyTorch, MLlib

Tools

Spark SQL, Jira, Rundeck

Paradigms

Data Science

Storage

数据管道,Amazon S3 (AWS S3)

Other

Machine Learning, Data Engineering, Language Models, Artificial Intelligence (AI), Deep Learning, Data Modeling, Text Generation, 自然语言处理(NLP), Large Language Models (LLMs), Amazon Machine Learning, GPT, 生成预训练变压器(GPT), Engineering, Software Engineering, Physics, Big Data, Data Mining, Foundry, Data Visualization, Serverless, Speech Recognition, Prompt Engineering

Platforms

亚马逊网络服务(AWS)、Docker、Kubernetes、谷歌云平台(GCP)

Industry Expertise

Telecommunications

2017 - 2018

计算机科学硕士论文

麻省理工学院-美国波士顿剑桥市

2015 - 2018

计算机科学硕士学位

苏黎世联邦理工学院-苏黎世,瑞士

2012 - 2015

软件工程学士学位

米兰理工大学-米兰,意大利

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

Top talent is in high demand.

Start hiring