Chức năng này có tên gọi là " automatic alternative text" (gọi tắt làAAT), theo đó khi có một tấm hình được chia sẻ qua Facebook, AAT sẽ mô tả lại theo dạng chữ viết trước, sau đó tận dụng VoiceOver trên iPhone để đọc to lên cho người dùng nghe.
Trước mắt thì công nghệ của Facebook có thể nhận diện được một số vật thể cơ bản như xe cộ (xe hơi, thuyền, motor,...), thiên nhiên (các khung cảnh ngoài trời, núi, sóng biển, mặt trời, cỏ,...), thể thao (tennis, bơi lội, sân vận động,...), thức ăn (kem, sushi, món ăn tráng miệng,...) và một số từ mô tả khác như trẻ con, kính mát, trang sức, cười, tự chụp ảnh khuôn mặt,...Trước mắt thì AAT sẽ có trên iOS trước, sau đó sẽ có cho Android và nền Web. (tất nhiên là đọc bằng Tiếng Anh, Facebook hứa hẹn sẽ bổ sung thêm nhiều ngôn ngữ trong tương lai không xa).
Automatic Alternative Text là công nghệ được nhóm trợ năng của Facebook phát triển trong nhiều tháng qua, nhóm này được dẫn đầu bởi Jeff Wieland và tư vấn bởi Matt King (vị kỹ sư bị mù đầu tiên của Facebook). AAT về cơ bản sẽ tận dụng hệ thống trí thông minh nhân tạo của Facebook để đưa ra các dự đoán vật thể trong ảnh. Trước khi có AAT thì VoiceOver trên iPhone chỉ có thể đọc được tên người chia sẻ bức ảnh hay đọc dòng trạng thái mà họ chia sẻ.
Vào cuối năm ngoái thì Facebook cũng trình diễn trí tuệ nhân tạo của họ có thể nhận diện các vật thể trong bức hình, nhận biết được nó ở xa hay gần và nói lại cho những người có vấn đề về mắt. Theo Facebook thì hệ thống của họ hoạt động nhanh hơn 30% so và sử dụng dữ liệu huấn luyện ít hơn 10 lần so với giải pháp tốt nhất trước đó. Facebook cũng cho biết họ rất thận trọng trong việc đưa ra các dự đoán vật thể trong ảnh, đặc biệt là ảnh liên quan đến vấn đề chủng tộc, do đó họ sẽ cẩn thận kiểm tra hoặc sẽ không đưa ra bất kỳ gợi ý hay dự đoán nào vì "đôi lúc không có dữ liệu nào còn tốt hơn dữ liệu tệ".