2026年面经

2026年面经

面试结果:

投递简历300+,约面20场,面试12场,通过4场,最终拿到1个offer。

序号 面试时间 面试公司 面试岗位 是否通过
1 3.9 快手 Java开发(KPI面) 未通过
2 3.11 B站 客户端开发一面 通过
3 3.12 美团 Java开发 未通过
4 3.12 B站 客户端开发(二面) 未通过
5 3.13 高德 Java开发 未通过
6 3.20 美团 大模型应用开发 未通过
7 3.23 快手 后端AI开发 未通过
8 4.20 汇川技术 Agent应用开发 通过
9 4.23 汇川技术 Agent应用开发(二面) 未通过
10 4.24 B站 开发实习生一面 通过
11 4.25 南芯半导体 Agent开发实习生 未通过
12 4.27 B站 开发实习生(二面) 通过

以下基于豆包分析录音生成

1 快手JAVA一面 KPI面(30分钟/3.9)

  1. 问个人情况?
  2. 问论文,介绍一下论文?
  3. 讲一下你的项目流程?
  4. 线程池的参数有哪些,你都是怎么设置的?
  5. 写一个动态规划算法,一般要注意什么?
  6. 介绍一下IOC和AOP?
  7. 介绍一下redis持久化的机制?
  8. 介绍一下你的项目中是如何构建一个ES搜索服务的?
  9. 介绍一下JVM内存结构?

算法:反转链表

2 B站客户端一面 (30分钟/3.11)

(一)背景与岗位匹配类

  1. 你做过客户端开发的工作吗?
  2. 你是只用过Java,Kotlin这门语言你听过吗?

(二)Java基础 - JVM与垃圾回收类

  1. 讲一下Java对象的生命周期?
  2. 谈一下你对垃圾回收的理解?
  3. 垃圾的定义有两种方法,除了可达性分析还有一种是什么?分别详细讲解这两个方法。
  4. 垃圾回收算法的种类(新生代、老年代相关GC)有哪些,分别讲讲?
  5. 详细说说标记清除、标记整理、复制这三种垃圾回收算法?
  6. Minor GC、Full GC一般分别用哪种垃圾回收算法,结合存活对象/垃圾对象的数量分析?
  7. 对于Java的内存优化有什么理解和想法?有没有用过内存友好的数据结构?如何避免内存泄漏的经验?

(三)Java基础 - 集合与哈希类

  1. 用过HashMap吗?讲一下HashMap中哈希的原理?
  2. equals和==的区别是什么?
  3. 哈希冲突的解决办法有哪些?HashMap是如何解决哈希冲突的?
  4. HashMap的初始容量、负载因子分别是什么?为什么初始容量是2的幂次方?为什么负载因子是0.75?
  5. HashMap是线程安全的吗?
  6. Hashtable相较于ConcurrentHashMap解决线程安全问题有什么不好的地方?

(四)Java基础 - 并发编程类

  1. 讲一下你对synchronized的了解?
  2. 你理解的线程安全是什么?线程安全的三要素是什么?
  3. synchronized保证了线程安全的哪些特性?它是怎么保证可见性的?
  4. synchronized可以修饰什么东西?修饰静态方法时锁的是什么?修饰非静态方法时锁的是什么?
  5. synchronized有哪些特点(可重入、公平性等)?
  6. synchronized的锁膨胀优化过程是什么?
  7. 什么是CAS操作?

(五)AI应用与认知类

  1. 你用过OpenAI、ChatGPT等AI工具吗?你是怎么看这些AI工具的?
  2. 你具体是怎么用AI工具做项目、写代码的?AI生成的代码占比大概有多少?
  3. 你觉得使用AI工具存在哪些风险和不顺手的地方?

3 美团JAVA一面(45分钟/3.12)

(一)高并发秒杀系统项目深挖

  1. 展开讲秒杀系统中多种高并发策略的实现、区别、优缺点,以及不同场景的选型依据;
  2. 仅判断库存大于零能否解决CAS的ABA问题?不用原子类仅用Integer能否解决ABA问题?分布式场景下如何解决ABA问题?
  3. 用线程池削峰填谷的好处、坏处分别是什么?线程池队列满了会发生什么?
  4. 服务器扩容后,单机线程池在分布式场景下会导致什么问题?
  5. 单机场景下对比synchronized锁、数据库乐观锁、Redis+MQ异步落库三种秒杀方案的优劣;
  6. 秒杀场景中选择MongoDB而非MySQL的原因?二者核心区别是什么?
  7. MongoDB的集群部署机制有哪些?数据分片的策略有哪些,该策略的专业名称是什么?

(二)设计模式相关

  1. 基于责任链模式做的预处理器机制有什么好处?没有该模式会有什么问题?
  2. 除了责任链模式,还有哪些更好的设计模式解决if-else嵌套问题?为什么选择责任链而非状态机模式?
  3. 除了责任链、状态机模式,还了解哪些设计模式?

(三)Spring相关

  1. 选择Spring StateMachine做状态机管理的原因?调研过其他状态机框架吗?该框架的优势是什么?

(四)AI医疗微服务平台项目深挖

  1. RAG检索增强的好处是什么?没有RAG直接调用大模型会存在什么问题?
  2. 除了RAG,还有哪些方式能为大模型提供领域上下文?
  3. 微调有哪些技术手段?
  4. Nacos作为注册中心的作用是什么?为什么需要注册中心?
  5. 服务调用时是否需要实时从Nacos拉取服务信息?有什么机制减少对Nacos的请求?
  6. 注册中心存在什么坏处?如果注册中心挂了,所有服务会不可用吗?
  7. 注册中心的注册表该如何设计?用什么存储类型/数据结构实现?
  8. Redis挂了该如何处理?能否用Caffeine做本地注册表?
  9. Caffeine作为本地注册表的好处、坏处分别是什么?
  10. 注册中心和本地注册表之间的更新机制是什么?

(五)缓存相关

  1. 二级缓存(Caffeine+Redis)中,如何解决Redis更新后多节点Caffeine数据不一致的问题?

(六)算法编程题

  1. 实现二叉树的层序遍历,分析算法时间复杂度;
  2. 手写线程安全的单例模式(后续因不会换题)。

4 B站客户端二面(20分钟/3.12)

(一)岗位匹配与客户端基础类

  1. 你有过端上应用级开发/DEMO编写的经验吗?
  2. 对端上的标准技术栈有了解吗?
  3. 了解端上的消息通信方案是怎样的吗?
  4. 安卓中比较常用的本地数据存储方式有哪些?
  5. 了解端上的一些UI组件吗?
  6. 对标准的视频播放协议流程有了解吗?

(二)AI核心技术类

  1. 说说RAG、MCP的技术流程和技术交互栈分别是怎样的?
  2. 什么是向量化?
  3. 做向量化匹配时的主要标准是什么?
  4. MCP协议的本质构成是什么?
  5. 尝试过在本地部署AI服务吗?
  6. 部署本地大模型服务时需要注意哪些问题?

(三)服务端高并发与缓存类

高并发业务场景下,设计服务端缓存架构需要注意哪些东西?

(四)方案设计类

如果要做本地数据库的升级方案,过程中需要注意哪些问题?

(五)项目与技术分享类

有没有做过有趣/有技术深度的东西,可以做基础分享?

5 高德JAVA一面(55分钟/3.13)

(一)AI医疗微服务平台项目深挖

  1. 如何对大模型的回答和行为进行约束?
  2. 使用提示词(Prompt)时需要注意哪些要点?
  3. 若大模型给出错误医疗建议,如何从系统层面发现/拦截?
  4. 如何解决大模型对话的上下文超限(无法回话)问题?
  5. 图片上传时若出现图片过大、超时问题,该如何解决?
  6. 设计C端多张大图同时上传的方案,该如何设计?
  7. 数据量特别大时,分页查询该如何优化(深度分页问题)?
  8. 该医疗系统能承受的QPS是多少,如何测试?

(二)数据库核心知识

  1. MySQL中binlog的作用是什么?有几种模式,分别是什么?
  2. MongoDB和MySQL的核心区别是什么?
  3. MySQL的索引有哪些类型,分别有什么特点?
  4. 聚簇索引和非聚簇索引的区别是什么?
  5. B+树作为索引结构的核心特点是什么,与哈希表、B树的区别?

(三)并发编程与锁

  1. synchronized锁和Redis分布式锁的区别及各自原理?
  2. 使用线程池的注意事项有哪些,核心参数该如何设置?
  3. Java为何会出现并发问题,需要用锁来处理?
  4. JVM中工作内存和主内存的区别是什么?
  5. 若在Controller中定义int字段,每次请求对其+1会出现什么问题?
  6. Java对象头的作用是什么,与锁有什么关联?

(四)MQ核心知识

如何保证MQ中的消息不丢失?

(五)高并发秒杀系统项目深挖

  1. 高并发秒杀系统的整体设计流程是什么?
  2. 秒杀系统中状态机的具体状态有哪些,依靠什么事件流转?
  3. 为什么采用状态机模式处理秒杀业务,与传统写法相比的好处是什么?

(六)JVM核心知识

  1. 哪些对象会进入JVM的老年代?
  2. 若新生代内存不足,会如何处理?

(七)算法编程题

一个从小到大、一个从大到小的两个数组,合并成一个整体从小到大的新数组。

6 美团大模型应用开发一面(一个小时/3.20)

(一)Java后端核心基础

  1. 讲解Redis跳表的底层数据结构,以及Redis为何选用跳表而非B+树、红黑树等数据结构?
  2. 简述红黑树的核心规则和特性?
  3. 介绍Java的类加载机制,核心步骤有哪些?
  4. 讲解Java的双亲委派机制,包含哪些类加载器、核心原理及设计好处?

(二)AI医疗微服务平台项目深挖

  1. 详细介绍AI医疗微服务平台的核心功能,重点讲RAG的落地实现?
  2. 项目中图像识别功能的识别对象、核心目的是什么?
  3. 自定义Memory组件的作用是什么,为何选用MongoDB存储对话上下文而非MySQL?
  4. 医疗问诊场景下的提示词工程体系是如何构建的?
  5. 除了角色定义、结构化输出约束,提示词工程还有哪些优化方法?
  6. RAG知识库的数据源来自哪里?
  7. 各类医疗文档(PDF/Word/TXT)如何转化为RAG的知识库,核心步骤是什么?
  8. 你认为当前这个医疗平台存在哪些优化点、做得不好的地方?
  9. 什么是大模型幻觉问题,你的项目中是如何尝试解决的?
  10. 该医疗平台在医疗问诊场景下对用户的核心价值是什么?

(三)高并发秒杀系统项目

秒杀系统是否和AI做了结合,具体是如何结合的?

(四)AI工具使用与认知

  1. 了解RAG、Agent吗?是否实际做过Agent相关开发?
  2. 日常使用AI编程工具(如Coding)的频率和方式是什么?
  3. AI生成代码的质量如何,使用过程中遇到了哪些问题,如何解决?

(五)算法编程题

  1. 根据指定字符串构建多叉树;
  2. 手写算法题:给定整数数组,找出最大子数组和;
  3. 要求阐述算法思路并完成代码实现。

7 快手 后端AI开发(一个小时/3.23)

(一)实习与个人基础信息

  1. 目前是否在校,多久能到岗实习、实习时长?
  2. 学校是否有其他事务(如论文)影响实习?

(二)AI医疗微服务平台项目深挖

  1. 挑一个核心项目详细介绍,重点讲核心功能和技术落地;
  2. 项目中提示词工程的编写、调优有哪些心得?
  3. 详细说说RAG的具体工作流程?
  4. 对Milvus向量数据库做过性能压测吗?单次请求耗时、读写QPS有关注吗?是否看过官方性能评测?
  5. 如何评测RAG返回回答的质量,有哪些具体方法?
  6. 为提升回答精准度做了哪些优化?

(三)大模型基础原理

  1. 了解大模型的Transformer架构吗?简单说说核心组成;
  2. Transformer架构的出现解决了传统模型(RNN/CNN)的什么问题?为什么传统模型会出现该问题?
  3. CNN中是否有注意力机制?

(四)Java核心基础与新特性

  1. 开发主要用Java,使用的版本是什么?Java 8/11/17/21有哪些新特性,在编码中实际用过哪些?
  2. Lambda表达式的底层实现原理是什么?
  3. 了解Java 21的虚拟线程吗?和守护线程有什么关联?

(五)JVM/并发/集合核心原理

  1. ThreadLocal在线程池使用中为什么会出现内存泄漏,如何避免?
  2. 介绍AQS的核心设计思路,以及它在ReentrantLock中的应用?
  3. HashMap在Java 8中的扩容机制,如何保证扩容效率?
  4. 了解Java 21的垃圾收集器吗?对比G1和CMS的适用场景?
  5. 线上监控发现JVM堆内存有问题,该如何排查?用到哪些工具?

(六)数据库/Redis核心原理

  1. MySQL的MVCC是如何实现的?
  2. MySQL的读已提交可重复读隔离级别有什么区别?分别如何实现?
  3. Redis在项目中主要用做什么?用到了哪些数据结构?
  4. Redis的ZSet底层数据结构是什么?详细讲讲跳表的原理和优势?

(七)AI技术认知与算法编程

  1. 平时如何学习AI相关技术?现阶段你认为比较前沿的AI技术/产品有哪些?是否实际实践过?
  2. 如何理解大模型的Skills?
  3. 若来快手实习,能否接受主要做提示词工程、模型调优/训练相关的AI开发工作?
  4. 算法编程题:实现大数相加功能(字符串形式的两个大数字相加,避免溢出),并阐述大数相乘的实现思路。

8 汇川技术 Agent应用开发一面(20分钟/4.20)

1. 爬虫与数据采集模块

  1. 介绍一下自动爬取新闻的整体流程?
  2. 网页改版导致DOM结构变化、解析失败,你有什么监控机制?如何快速定位、修复?
  3. 新闻时效性要求高,你如何保证数据最新
  4. 定时任务4小时跑一次,任务挂掉/异常如何保证高可用?靠人工盯着吗?

2. RAG 评估与指标

  1. 你项目里说的 相关性、准确性 这两个指标,计算公式是什么
  2. 用RAGAS评估时,具体是怎么计算的?

3. Agent 工具扩展与热更新

  1. 新增一个“获取最新论文”的工具,需要改哪些代码?服务要不要重启?
  2. 你提到用MCP做可扩展工具系统,MCP支持工具热加载吗?
  3. MCP 模块和你内部 LangGraph 节点是什么关系?
  4. 把MCP去掉,系统还能跑吗?
  5. 既然能跑,为什么还要做MCP?对你这个Agent系统本身的业务价值是什么?

4. Agent 异常与容错机制

  1. 工具调用失败怎么处理?
  2. 工具循环调用(死循环)怎么解决?

9 汇川技术 Agent应用开发二面(20分钟/4.23)

1. RAG 评估与指标

  1. 你是如何对新闻问答系统做评估的?
  2. 你提到的准确率 90%+ 是怎么计算的?指标具体是什么?
  3. 大模型评估指标(忠实度、相关性等)为什么能达到这么高?

2. 大模型幻觉治理(核心追问)

  1. 你主要靠什么方法降低模型幻觉?
  2. 召回文档不准确、包含无效信息时,怎么避免模型据此产生幻觉?
  3. Query 改写和降低幻觉有什么直接关系?
  4. 微调为什么能降低幻觉?原理是什么?
  5. 新闻问答必须严格依据召回内容,不能用模型固有知识,你怎么强约束?

3. 提示词工程与方法论

  1. 提示词不能只笼统说“写得更好”,你用过哪些具体方法论?(如 CoT、引用原文、标注来源等)
  2. RAG 上下文、召回结果在提示词里怎么组织更有效?

4. MCP 协议与工具调度

  1. MCP 和提示词是什么关系?
  2. 当工具数量极多(上千个)时,如何让模型精准选对工具?
  3. 工具描述过长占满上下文,怎么解决?

10 B站 开发实习生一面(35分钟/4.24)

1. 基础信息与求职意向

  1. 做个简短自我介绍。
  2. 课程多吗?能否到上海实习?
  3. 有无实习经历?
  4. 目标岗位是什么?(Agent / Java后端)
  5. 平时编码用什么工具、AI辅助工具?
  6. 手写代码多吗?

2. 算法题考察

  • 算法题:和为n的完全平方数最少数量(类似279.完全平方数)

3. AI新闻问答Agent项目深挖

  1. 项目思路来源、是否网上教程或自己设计?
  2. 技术选型:为什么选 LangGraph,不选 LangChain?
  3. 最终实现效果、部署情况?
  4. 爬虫逻辑:离线还是实时?数据源?
  5. 检索召回怎么做?(向量、ES、混合检索)
  6. 多实体、多主题查询如何分别召回?(如 GPT vs DeepSeek)
  7. RAG 准确率 90%+ 如何评测?用了什么指标?
  8. 项目代码量大概多少?自己手写占多少?
  9. MCP 服务用什么语言实现?作用是什么?

11 南芯半导体 Agent开发实习生(45分钟/4.25)

1. 学习经历与入门过程

  1. 从什么时候开始接触 AI?学习路径与方式是什么?
  2. Agent 项目从0到1是如何开始、如何学习、如何落地的?

2. 医疗服务平台项目深挖

  1. 做医疗平台的初衷是什么?为什么选医疗方向?
  2. 整体架构思路与设计原因是什么?技术栈为什么这么选?
  3. 患者问答哪些走大模型、哪些走后台流程,如何区分?
  4. 关键词路由医疗问答的缺陷是什么?如何解决动态知识库更新?
  5. 平台除了对话和 RAG,还实现了哪些后端功能?

3. AI 新闻问答 Agent 项目深挖

  1. 从0到1的完整流程、框架构思、选型原因?
  2. 混合检索(向量+ES+BM25+Rerank)具体如何实现?
  3. 评估指标与评测过程是什么?数据是否可信?
  4. 三层记忆系统(短期/中期/长期)如何实现?和上下文管理的关系?
  5. LangChain、LangGraph 分别在项目里承担什么作用?
  6. 调试流程如何保证每一步符合预期?
  7. MCP 工具注册、作用、调用逻辑是什么?
  8. 项目代码量、手写占比、开发周期?
  9. 你在项目里最大价值是什么?
  10. 项目是否上线?数据存储、用户管理、权限如何做?

4. 技术广度与工程化

  1. 了解过哪些开源 RAG/Agent 组件?低代码平台?
  2. 除了 RAG,还有哪些技术解决幻觉?

12 B站 开发实习生二面(25分钟/4.27)

1. AI 新闻问答项目深挖

  1. 介绍一下你的 AI 新闻问答系统。
  2. 数据来源是什么?爬虫是自己写的还是 AI 写的?是否用到 RSS?
  3. 为什么不直接用 Tavily 这类联网搜索 API,而要自己做爬虫 + RAG?
  4. 项目来源是什么?是作业、教程,还是兴趣驱动?
  5. 项目初期你是怎么定目标、定需求的?
  6. 接入微信用的是 OpenCopilot 吗?用的什么模型?
  7. 开发代码主要用什么工具?是否使用 AI 辅助编码?

2. 场景题:入职第一天排查线上问题(核心重点)

  1. 给你:代码库 + 文档 + MCP 工具(日志/DB查询),第一天入职怎么排查线上问题?
  2. 为什么要用 grep 搜代码,而不是用 MCP 工具?
  3. 你不懂业务,AI 给了你4个原因和方案,你如何判断 AI 结论可信?
  4. 如果项目是 Go 语言,你完全看不懂,怎么保证 AI 结论正确?
  5. 如果是前后端协作项目,你也不懂前端,怎么处理?