Brief Intro to ViT

最近 Transformer 非常流行。Transformer 本身应用在 NLP 中,直到 2020 年 Google 带来了视觉领域的应用 Vision Transformer(ViT)。其在图像分类上达到了接近 SOTA 的程度,标志着视觉中 self-attention 类网络也可以很好的代替 CNN 完成工作。许多人甚至认为 Transformer 开启了视觉的新时代,未来能完全取代 CNN。

下载 m3u8 格式视频

最近想通过看美剧的方式提高下听力水平。在浏览器上播放美剧,频繁的倒带往往会出发缓存重新加载,体验很不好。而且,为了达到联系效果,往往需要将一集视频重复观看多遍。这个时候就比较希望能够把视频文件直接下载下来,一劳永逸。

查看源文件

Understanding MobileNet v2

随着深度学习的发展,神经网络为了追求精度,结构越来越深、参数也越来越多。Google 推出的 MobileNet 在 accuracy 和 latency 之间做了平衡,更适合在计算力不足的移动端和嵌入式设备上应用。由于参数量比 ResNet 等网络少了很多,也适合我们在研究初期快速验证想法。

2021-2023 Objectives

为避免 OKR 相关的文章太多污染博客,因此将全年目标汇总。

2021

1-2 双月

O1 - DL 进阶 0.6

  • KR 1:接手现有代码,理解并复现实验结论 0.8
  • KR 2:实现新想法,产生对比数据 0.5
  • KR 3:认真完成 CMU 课程作业,巩固基础知识 0.6
  • KR 4:完成一个除分类外的其他 project,如分割等 0.0

X11 Forwarding on macOS

通过 VSCode 的 Remote - SSH extension 直接在远程服务器上编写代码是非常方便的,体验和直接在本地开发没有什么区别。但是,当我们想使用 matplotlib 之类的库展示图片的时候,就需要额外做一些配置了。

安装 X11 Window System

Forward & Backward Pass of Batch Normalization

2020年12月OKR

2020 年是很不平凡的一年。于我个人而言,我决定离开字节跳动,跳出舒适圈,开始新的征程。虽然离开了公司,但设定目标的好习惯还是要坚持下去~

O1 - 入门深度学习,能够上手做实验

  • KR 1 - 看完 CS231N,并完成 assignment 2 & assignment 3
  • KR 2 - 了解 ResNet50 等常用网络结构
  • KR 3 - 阅读论文,补齐数字信号处理等基础知识,并做一次串讲
  • KR 4 - 成功复现论文,并探索改进方式

Advanced Filter on Kibana

在 Kibana 上,我们经常使用 Filter 来过滤掉无用的信息。比如,我想关注 _id 为 123 的用户的一些指标,只需要添加一个这样的 Filter 就可以了:

Intro to CocoaPods

就像 JavaScript 的 NPM,Python 的 pip,Java 的 Gradle,甚至 Ubuntu 的 apt-get 一样,我们在使用 Xcode 开发软件时也需要使用包管理工具。CocoaPods 就是这样的一款用 Ruby 编写第三方库依赖管理工具,每个 iOS Developer 都不会对它感到陌生。

Design Patterns

设计模式可以帮助我们更好地组织代码结构。模式是针对软件设计中常见问题的解决方案工具箱,它们定义了一种让团队更高效沟通的通用语言。每个模式就像一张蓝图,我们可以通过对其进行定制来解决代码中的特定设计问题。

Catalog

Creational Patterns 创建型模式

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×