08.HTTP 헤더2 - 캐시와 조건부 요청
캐시 기본 동작
- 캐시가 없을 경우 같은 내용을 요청하면 같은 용량에 대해 요청한 만큼 받는다
- 캐시가 있다면, 캐시의 유효 시간이 초과하지 않고 같은 요청을 한다면
- 웹브라우저는 브라우저의 캐시 저장소를 탐색하여 요청에 대한 내용을 출력한다.
- 만약 캐시의 유효시간이 끝났다면, 서버에 요청하여 다시 응답받고 캐시 저장소에 저장하여 유효시간을 갱신한다.
검증 헤더와 조건부 요청1
- 캐시 유효 시간이 초과해서 서버에서 다시 요청하면 두 가지 상황이 발생
- 서버에서 기존 데이터를 변경함
- 서버에서 기존 데이터를 변경하지 않음
- 만약 캐시의 유효시간이 끝났지만 서버에 요청한 데이터가 기존 캐시저장소에 있던 데이터와 동일하다면? 또 불필요하게 서버에서 데이터를 다운받아야 할까???
- 이러한 경우에는 데이터를 전송하는 대신에 저장해 두었던 캐시를 재사용할 수 있다
- 단, 클라이언트 데이터와 서버의 데이터가 같다는 사실을 확인할 수 있는 방법이 필요하다
- 이 방법이 검증 헤더이다
- 검증 헤더 추가
- 첫번째 요청에서 헤더에 Last-Modified 데이터를 추가한다
- 마지막 수정 시간 내용이 들어간다.
- 캐시 저장소에서 캐시를 저장할 때, 데이터 최종 수정일을 기록한다
- 캐시 유효시간이 끝나고 클라이언트가 서버에 요청할 때 요청 메시지에 데이터 최종 수정일(if-modified-since)을 같이 보낸다
- 서버에서는 요청에 딸려온 데이터 최종 수정일을 비교하고
- 304 Not Modified로 보낸다. 이때 Last-Modified를 같이 실어보낸다
- 그리고 중요한 것을 이때에는 HTTP Body의 내용은 전송하지 않는다
- 클라이언트는 서버가 보낸 응답 헤더 정보로 캐시의 메타 정보를 갱신한다
- 클라이언트는 캐시에 저장되어 있는 데이터를 재활용한다
- 결과적으로 네트워크에서 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드하게 된다
- 서버 다운의 부하가 줄어들고 응답시간이 빠른 효과를 가져올 수 있다
검증 헤더와 조건부 요청2
- 검증 헤더
- 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
- Last-Modified, ETag
- 조건부 요청 헤더
- 검증 헤더로 조건에 따른 분기
- if-Modified-Since : Last-Modified 사용
- if-None-Match : ETag 사용
- 조건이 만족하면 200 OK
- 조건이 만족하지 않으면 304 Not Modified
- if-Modified-Since & Last-Modified
- 데이터 미변경 예시
- 캐시: 2024년 01월 25일 10:00:00 vs 서버: 2024년 01월 25일 10:00:00
- 실패(변경되었나요?라고 질문 했는데 안바꼈으니, false)
- 304 Not Modified, 헤더 데이터만 전송(Body 미포함)
- 전송 용량 0.1M (헤더 0.1M, 바디 1.0M)
- 데이터 변경 예시
- 캐시: 2024년 01월 25일 10:00:00 vs 서버: 2024년 01월 26일 10:00:00
- 성공
- 200 OK, 모든 데이터 전송(Body 포함)
- 전송 용량 1.1M (헤더 0.1M, 바디 1.0M)
- 데이터 미변경 예시
- if-Modified-Since & Last-Modified의 단점
- 1초 미만 단위로 캐시 조정이 불가능
- 날짜 기반의 로직 사용
- 데이터를 수정해서 날짜가 다르지만, 같은 데이터를 수정해서 데이터 결과가 똑같은 경우
- 데이터를 수정했지만 결국 다시 원래상태로 돌린경우 수정날짜는 갱신되었지만 컨텐츠 자체는 같음
- 서버에서 별도의 캐시 로직을 관리하고 싶은 경우
- 주석같은 경우는 컨텐츠에 영향을 주는게 아니기 때문에 캐시를 유지하고 싶은 경우
- ETag & if-None-Match
- ETag(Entity Tag)
- 캐시용 데이터에 임의의 고유한 버전 이름을 달아둔다
- 데이터가 변경되면 이 이름을 바꾸어서 변경한다(Hash를 다시 생성)
- 진짜 단순하게 ETag만 보내서 같으면 유지하고 다르면 다시 받는다
- 작동원리는 if-Modified-Since & Last-Modified와 같다
- ETag & if-None-Match 정리
- 단순하게 ETag만 서버에 보내서 같으면 유지, 다르면 받기
- 캐시 제어 로직을 서버에서 완전히 관리한다
- 클라이언트는 단순히 이 값을 서버에 전송한다.(캐시 매커니즘을 모른다)
- 예) 애플리케이션 배포 주기에 맞춰서 ETag를 모두 갱신
캐시와 조건부 요청 헤더
- 캐시 제어 헤더
- Cache-Control : 캐시제어
- Pragma : 캐시 제어(하위 호환)
- Expires : 캐시 유효 기간(하위 호환)
- Cache-Control : 캐시제어
- Cache-Control : max-age
- 캐시 유효 시간, 초 단위
- Cache-Control : no-cache
- 데이터는 캐시해도 되지만, 항상 origin 서버에 검증하고 사용한다.
- 중간 캐시 서버가 무수히 많다.
- Cache-Control : no-store
- 데이터에 민감한 정보가 있으므로 저장하면 안된다.
- 메모리에서 사용하고 최대한 빨리 삭제
- Cache-Control : max-age
- Pragma : 캐시 제어(하위 호환)
- Pragma : no-cache
- HTTP 1.0 하위 호환
- Expires : 캐시 유효 기간(하위 호환)
- 캐시 만료일을 정확한 날짜로 지정
- HTTP 1.0부터 사용
- 지금은 더 유연한 Cache-Control : max-age를 권장한다
- Cache-Control : max-age와 함께 사용되면 Expires는 무시된다
프록시 캐시
- 원 서버 직접 접근(origin 서버)
- 만약 한국에 있는 클라이언트가 미국에 있는 서버에 직접 접속 한다고 하면 1초의 시간이 걸린다.
- 여러 클라이언트가 미국 서버에 접속하면 각자 1초의 시간이 걸리는 것이다.
- 근데 한국에 미국 서버와 통신하는 프록시 캐시 서버를 만든다고 하면
- 한국 클라이언트는 프록시 캐시 서버를 통해 원하는 자료 요청을 하기 때문에 데이터 다운 시간이 0.1초로 줄어들 수 있을 것이다.
- 물론 처음으로 데이터 요청을 한 클라이언트는 프록시 서버에 캐시 데이터가 없기 때문에 시간이 걸리지만
- 그 이후 클라이언트들은 프록시 캐시 서버에 캐시가 저장되어 있기 때문에 응답을 빠르게 받을 수 있게 된다
- 여기서 클라이언트들에게 있는 캐시를 private 캐시라고 하고
- 프록시 캐시 서버에 있는 캐시를 public 캐시라고 한다
- Cache-Control : public
- 응답이 public 캐시에 저장되어도 됨
- Cache-Control : private
- 응답이 해당 사용자만을 위한 것임, private 캐시에 저장해야 함(기본값)
- Cache-Control : s-maxage
- 프록시 캐시에만 적용되는 max-age
- Age: 60(HTTP 헤더)
- origin 서버에서 응답 후 프록시 캐시 내에 머문 시간(초)
캐시 무효화
- 확실한 캐시 무효화 응답
- 캐시를 적용을 안해도 웹브라우저들이 GET 요청인 경우에는 임의로 캐시를 해버리기도 한다
- 그래서 여기서는 무조건 캐시를 하면 안되라고 하려면 밑의 것들을 다 넣어 주어야 한다
- Cache-Control : no-cache, no-store, must-revalidate
- Pragma: no-cache
- Cache-Control : must-revalidate
- 캐시 만료 후 최초 조회시 원 서버에 검증해야 한다
- 원 서버 접근 실패 시 반드시 오류가 발생해야 한다 - 504(Gateway Timeout)
- must-revalidate는 캐시 유효 시간이라면 캐시를 사용함
- no-cache와 must-revalidate 의 차이
- no-cache의 경우
- 캐시 사용을 위해 원서버로 검증을 요청한다.
- 프록시 서버에서는 캐시 요청을 받고 원 서버로 캐시 요청을 보낸다
- 원서버에서 프록시 서버로 응답해준다.
- 프록시 서버에서 클라이언트로 응답해준다
- 만약 프록시 서버와 원서버 사이에 네트워크 단절이 발생하면
- 몇몇 프록시 서버에는 사용자의 편의를 위해 에러보다는 옛날 캐시라도 보여주는 것이 낫다고 판단해 세팅이 되어 있는 경우가 있다
- 이렇게 되면 옛날 캐시로 다시 데이터 다운이 일어나게 된다
- must-revalidate의 경우
- 만약 프록시 서버와 원서버 사이에 네트워크 단절이 발생하면
- 프록시 서버는 클라이언트에게 504에러로 응답하게 된다
출처
- 인프런의 김영한님의 강의를 듣고 정리한 것입니다.